- 데이터의 실측치와 모델의 추정치의 차이인 잔차가 i.i.d.를 만족해야함.
- i.i.d. (Independent and Identically Distributed random)
- 잔차의 분포는 정규분포
- 확인방법
- 잔차의 히스토그램
- Shapiro-Wilk normality test
- 결과로 나온 p-value가 높으면 정규분포를 따름.
- normal quantile plot
- Skewness와 Kurtosis를 check
- skewness(third standardized moment): 분포가 얼마나 기울어 있나
- Kurtosis(fourth standardized moment): 분포가 얼마나 뚱뚱한가
- 자크베라(Jacqa Beata) test
- 잔차는 독립이어야 함
- 잔차와 독립변수 사이에 상관관계가 없고, 자기 자신과도 상관이 없어야 함.
- 확인 방법
- 독립변수와 잔차의 correlation
- scatter plot
- 잔차의 분포가 일정해야 함. (잔차의 등분산성)
- 출처(https://brunch.co.kr/@gimmesilver/17)이며, 읽고 간단히 키워드만 정리함.
Freakombination
2018년 4월 9일 월요일
회귀 모델링의 전제조건
피드 구독하기:
댓글 (Atom)
댓글 없음:
댓글 쓰기