We use cookies and other tracking technologies to improve your browsing experience on our website, to show you personalized content and targeted ads, to analyze our website traffic, and to understand where our visitors are coming from.
R lm 함수 뜯어보기
Published
March 24, 2024
다음과 같은 회귀식을 생각한다.
는 n p의 행렬이고, 는 n 1의 행렬이다.
우리는 보통 R의 lm 함수를 사용할 것이다. lm 함수를 직접 구현해보면서, 선형회귀의 핵심을 알아보자.
OLS 추정에 따르면, 오차를 최소화 하는 는 아래와 같다.
가 구해지면 예측값 를 구할 수 있고, 그러면 예측잔차 도 구해진다.
또한 회귀분석에서는 의 효과가 0과 다르다는 것을 검정하기 위해서, 회귀계수의 분산 을 알 필요가 있다. 이는 다음과 같다.
는 대각행렬의 원소를 의미한다.
다만, 가 알려지지 않았을 때는 로 대체 가능하다. 즉, 회귀계수의 분산식은 로 대체된다.
예제
와 가 아래와 같이 주어졌다고 하자.
n <-7p <-3X <-matrix(c(rep(1,n), -floor(n/2):floor(n/2), (0:(n-1))^2),nrow=n, ncol=p); X