2018년 4월 9일 월요일

회귀 모델링의 전제조건

  • 데이터의 실측치와 모델의 추정치의 차이인 잔차가 i.i.d.를 만족해야함.
    • i.i.d. (Independent and Identically Distributed random)
      • 잔차의 분포는 정규분포
        • 확인방법
          • 잔차의 히스토그램
          •  Shapiro-Wilk normality test
            • 결과로 나온 p-value가 높으면 정규분포를 따름.
          • normal quantile plot
          • Skewness와 Kurtosis를 check
            • skewness(third standardized moment): 분포가 얼마나 기울어 있나
            • Kurtosis(fourth standardized moment): 분포가 얼마나 뚱뚱한가
          • 자크베라(Jacqa Beata) test
      • 잔차는 독립이어야 함
        • 잔차와 독립변수 사이에 상관관계가 없고, 자기 자신과도 상관이 없어야 함.
        • 확인 방법
          • 독립변수와 잔차의 correlation
          • scatter plot
      • 잔차의 분포가 일정해야 함. (잔차의 등분산성)
  • 출처(https://brunch.co.kr/@gimmesilver/17)이며, 읽고 간단히 키워드만 정리함.

댓글 없음:

댓글 쓰기