회귀분석(23)
-
[회귀분석] 22. 사영 행렬로 표현한 잔차
■ 표준화 잔차
2025.04.11 -
[회귀모형] 21. (상수항을 포함한) 사영 행렬
■ 왜 또 사영행렬이냐?=> 사영행렬의 일부분인 "지레값(Leverage Value)"은 데이터 중에서 이상치(outlier)를 판단하는 데 사용됨. => 회귀모형의 가정 4가지 중 3가지는 오차항에 대한 것임. (우리가 손에 들고 있는 데이터에선 '잔차'에 해당함)사영행렬을 사용하면 잔차를 깔끔하게 표현해낼 수 있음. ■ 사영행렬 개념 돌아보기■ 단순선형회귀에서 사영행렬 직접 행렬 계산해보기■ 지레값(Leverage Value)사영행렬은 '서로 다른 두 데이터 포인트를 다루는 경우', '한 데이터 포인트를 다루는 경우'로 나눌 수 있음.이때 후자인 요소들을 '지레값'이라고 함. 지레값은 분모가 모든 데이터 포인트들이 각각 중심으로부터 떨어진 거리 제곱을 합해놓은 것으로,분자에 올라가는 해당 데이터가 ..
2025.04.10 -
[회귀분석 Ch5] 20. 회귀모형의 가정들
■ 회귀모형의 가정들 ※ 추가③ 예측변수들에 대한 가정 ● X1, X2, · · · , Xp are not random variables ● x1j, x2j, · · · , xpj are measured without measurement error for j = 1, 2, · · · , n ● X1, X2, · · · , Xp are linearly independent
2025.04.09 -
[회귀분석] 19. 다중회귀모형의 다양한 가설검정
■ 회귀계수 = 0 종류의 검정 ■ 회귀계수 간 동일성 & 관계 종류의 검정
2025.04.08 -
[회귀분석] 18. 완전모형-축소모형 가설검정, F 통계량
※ 개별 편회귀계수에 대한 t검정, 신뢰구간 그리고 결정계수 부분은 단순회귀모형과 같은 아이디어를 공유하므로 다루지 않음. 다만, 다중상관계수(R)는 '다수 설명변수 : 한 개 종속변수' 형태이기 때문에단순선형모형처럼 변수들의 순서를 바꾸면 당연히 다른 값이 튀어나올 것임. ■ 완전모형과 축소모형 ■ 가설검정 ■ 어떤 기준으로 위 가설들을 검증할 것이냐? => "오차를 얼마나 줄였나"
2025.04.07 -
[회귀분석] 17. 추정량은 어떤 분포를 따르는가? 2025.04.06