2018년 4월 11일 수요일

Model Selection Criteria ( R square, adjusted R square, AIC, SC, BIC)

  • 모델의 설명력을 평가하는 지표
  • R square = 1 - (SSE/SST)
    • 문제점은 irrelevant variables을 막 추가하면 R square가 증가함. 왜냐하면 변수가 많아지면 SSR이 증가하고 SSE가 감소하기 때문임. 이 때 다른 변수들의 standard error도 커짐.
  • adjusted R square
    • irrelevant variables의 추가에도  R square가 증가하는 문제점을 해결함.
    • adjusted R square = 1- ( (SSE/(N-K) / SST/(N-1) )
      • 독립 변수의 증가 -> SSE 감소, 그러나 (N-K)도 감소.
      • 독립 변수에 따른 penalty 효과를 줌.
  • Akaike informatio criteria(AIC)
    • 독립변수 추가에 penalty를 줌.
    • AIC 값이 작을 수록 좋다.
  • Schaarz criterion(SC) or Bayesian Information Criteria(BIC)
    • 독립변수 추가에 penalty를 줌.
    • 작을수록 좋다

댓글 없음:

댓글 쓰기