회귀분석(20)
-
[회귀분석] 22. 사영 행렬로 표현한 잔차
■ 표준화 잔차
2025.04.11 -
[회귀모형] 21. (상수항을 포함한) 사영 행렬
■ 왜 또 사영행렬이냐?=> 사영행렬의 일부분인 "지레값(Leverage Value)"은 데이터 중에서 이상치(outlier)를 판단하는 데 사용됨. => 회귀모형의 가정 4가지 중 3가지는 오차항에 대한 것임. (우리가 손에 들고 있는 데이터에선 '잔차'에 해당함)사영행렬을 사용하면 잔차를 깔끔하게 표현해낼 수 있음. ■ 사영행렬 개념 돌아보기■ 단순선형회귀에서 사영행렬 직접 행렬 계산해보기■ 지레값(Leverage Value)사영행렬은 '서로 다른 두 데이터 포인트를 다루는 경우', '한 데이터 포인트를 다루는 경우'로 나눌 수 있음.이때 후자인 요소들을 '지레값'이라고 함. 지레값은 분모가 모든 데이터 포인트들이 각각 중심으로부터 떨어진 거리 제곱을 합해놓은 것으로,분자에 올라가는 해당 데이터가 ..
2025.04.10 -
[회귀분석 Ch5] 20. 회귀모형의 가정들
■ 회귀모형의 가정들 ※ 추가③ 예측변수들에 대한 가정 ● X1, X2, · · · , Xp are not random variables ● x1j, x2j, · · · , xpj are measured without measurement error for j = 1, 2, · · · , n ● X1, X2, · · · , Xp are linearly independent
2025.04.09 -
[회귀분석] 19. 다중회귀모형의 다양한 가설검정
■ 회귀계수 = 0 종류의 검정 ■ 회귀계수 간 동일성 & 관계 종류의 검정
2025.04.08 -
[회귀분석] 17. 추정량은 어떤 분포를 따르는가? 2025.04.06
-
[회귀분석] 14. 표준화된 회귀계수, 베타계수
* 표준화된 회귀계수는 측정단위에 의존하지 않고, 순수 데이터들의 관계만 확인해볼 수 있다는 장점이 있다. * 단위가 말썽을 피울 때는 표준화 회귀계수를 이용하는 것이 방법이 될 수 있다. * (데이터 구조는 '[회귀분석] 12' 포스팅에서 사용했던 notation을 그대로 가져다 사용하겠음)
2025.04.03