본문 바로가기
Lecture/Theory Statistics

2. 통계량 Statistic

by iamzieun 2024. 6. 27.

통계량 statistic 은 ‘a function of one or more random variables that does not depend on any ‘unknown’ parameter’로 정의된다. 즉, \(X_1, \cdots, X_n\)이라는 확률변수들이 있을 때, 이 확률변수들을 입력으로 계산한 함수값 \(T=T(X_1, \cdots, X_n)\)이 통계량이 되는 것이다.

  • 이러한 통계량들 중에서
    • 모수를 추정하는데 쓰이는 통계량을 추정량이라 하고,
    • 모수에 대한 추정량을 검정하는데 쓰이는 통계량을 검정통계량이라고 한다. 
  • 그렇다면 수많은 통계량들 중에서, 어떤 것이 ‘좋은 통계량’일까?
    • 추정 - 추정량
      • \(\bar{X}\)와 \(X_1\) 중 어떤 값을 \(\mu\)에 대한 추정량으로 쓰는 것이 좋을까? 
        1. \(E(\bar{X}) = E(X_1)=\mu\)로, \(\bar{X}\)와 \(X_1\)은 모두 불편추정량이다.
        2. \(Var(\bar{X})=\frac{\sigma^2}{n} < Var(X_1)=\sigma^2\)이므로 분산이 더 작은 \(\bar{X}\)가 더 좋은 추정량이 된다.
        이처럼 추정량은 1) 불편추정량이면서 2) 작은 분산을 갖는 추정량을 좋은 추정량으로 본다.
    • 검정 - 검정통계량
      • \(\bar{X}\)와 \(X_1\) 중 어떤 값을 \(\mu\)에 대한 검정통계량에 쓰는 것이 좋을까?
      • 검정통계량은 1종오류를 \(\alpha\)로 고정했을 때, 2종오류를 최소화(검정력을 최대화) 하는 값을 좋은 검정통계량으로 본다.
      • 유의수준 \(\alpha=0.05\)에서 다음과 같은 단측 검정을 한다고 하자.

\(X_1\)을 검정통계량에 사용했을 때보다 \(\bar{X}\)를 사용했을 때의 검정력(대립가설이 참일 때 대립가설을 채택할 확률)이 더 높은 것을 확인할 수 있다. 이에 \(\bar{X}\)와 \(X_1\) 중에서는 \(\bar{X}\)가 더 좋은 검정통계량이라고 할 수 있다.

 

cf. 1종오류, 2종오류, 유의수준, 검정력 

  \(H_0\): true  \(H_0\): false
accept \(H_0\) \(1-\alpha\) \(\beta\): 2종오류
reject \(H_0\) \(\alpha\): 1종오류. 유의수준 \(1-\beta\): 검정력
  • 유의수준: 1종오류의 최댓값
  •  

댓글