채니의 개발일기

중심극한정리 본문

수학/통계학

중심극한정리

윤채니챈 2023. 7. 3. 22:56
728x90
반응형

중심극한정리

 

동전을 던져 앞면이 나올 확률을 R코드를 활용하여 계산해보자

library(ggplot2)
coins = c()

for (i in 1:10){
  
  coin = sample(x =c("H","T"), size = 100, replace =TRUE) 
  #replace= True를ㄹ 활용하여 복원추출
  probs = table(coin)/length(coin)
  #앞면("H")과 뒷면("T")의 빈도를 계산
  h_prob = probs["H"]
  #앞면이 나올 확률 계산
  
  coins[i]=h_prob
}

ggplot()+
  geom_histogram(aes(x=coins),binwidth = 0.01)+
  theme_bw()+
  theme(legend.position  ='bottom',
        text = element_text(size =12,face='bold'))

 

10번시행한 결과

 

for문을 100번 시행해서 앞면이 나올 확률

for문을 1000번 시행해서 앞면이 나올 확률

for문을 10000번 시행해서 앞면이 나올 확률

 

결과

 

  • 표본수가 증가 할 수록 표본평균의 분포가 대칭구조를 가지는 종 모양에 근접
  • 이 분포를 정규분포라고 정의
  • 현실에서 데이터 분석은 모집단에 대한 정확한 분포를 모르고 분석을 진행해야 하는데 중심 극한 정리가 이문제를 해결해줌
  • 중심극한 정리는 모집단의 분포를 모르는 상황에서도 다양한 통계이론을 전개 할 수 있는 근거를 마련

 

 -> 중심극한정리는 표본의 크기가 충분히 크다면, 모집단의 분포가 무엇인지에 상관없이 표본평균의 분포가 대칭적인 종 모양인 정규분포에 근접한다는 원리이다.

이를 통해 현실에서 모집단의 분포를 정확히 알지 못해도 통계 분석을 수행할 수 있다.

중심극한정리는 통계학에서 중요한 개념으로서, 표본의 크기가 충분히 크다면 모집단의 분포를 모르는 상황에서도 표본평균이 정규분포에 근사한다는 것을 보장한다. 

이는 통계적 추론을 할 때 유용하게 사용됩니다.

예를 들어, 가설 검정이나 신뢰구간을 구할 때, 표본 평균의 분포를 정규분포로 가정하고 분석을 진행할 수 있다.중심극한정리는 표본의 크기가 커질수록 정규분포에 근접하기 때문에, 통계 분석에서는 일반적으로 표본의 크기가 충분히 큰 경우를 가정하고 분석을 수행한다. 이를 통해 모집단에 대한 정확한 분포를 모르는 상황에서도 통계 이론을 전개할 수 있으며, 신뢰성 있는 결론을 도출할 수 있다.

 

-> 중심극한정리 예시상황

  1. 동전 던지기: 동전을 여러 번 던져서 앞면이 나올 확률을 추정하고자 할 때, 중심극한정리를 사용할 수 있다.  동전의 던지기는 베르누이 시행으로 볼 수 있으며, 표본의 크기가 충분히 클 경우, 동전의 앞면이 나올 확률의 분포가 정규분포에 근사한다고 가정할 수 있다.
  2. 투표 조사: 선거나 조사에서 특정 후보나 응답 항목에 대한 지지율을 추정하고자 할 때, 중심극한정리를 사용할 수 있다. 투표 조사는 이항 분포로 모델링될 수 있으며, 표본의 크기가 충분히 클 경우, 투표 결과의 분포가 정규분포에 근사한다고 가정할 수 있다.
  3. 제품 품질 테스트: 제조된 제품의 품질을 테스트하고자 할 때, 중심극한정리를 사용할 수 있다. 예를 들어, 제품의 중량을 측정하여 평균 중량을 추정하고자 할 때, 제품 중량의 분포가 정규분포에 근사한다고 가정할 수 있다.
  4. 인구 조사: 인구 조사에서 특정 인구 특성에 대한 평균 값을 추정하고자 할 때, 중심극한정리를 사용할 수 있다. 인구 조사는 대규모 표본을 사용하며, 표본의 크기가 충분히 클 경우, 인구 특성의 분포가 정규분포에 근사한다고 가정할 수 있다.

 

 

 

728x90
반응형