반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- DOMAPI
- Filter
- HTML
- 웹폰트
- Ajax
- JS
- 질의확장
- 클러스터링기법
- EC2
- DOM
- 정수인코딩
- NLP
- Ajax프레임워크
- R
- 자기지도학습
- 프로토콜
- Mac konlpy
- 행렬
- 함수
- CSS
- 인덱스
- 명령어
- 노마쌤
- 벡터
- 노트list
- 유의수준
- 신뢰구간
- 매일영어습관
- 노마쌤과 즐거운 영어 습관
- 파이썬
Archives
- Today
- Total
채니의 개발일기
중심극한정리 본문
728x90
반응형
중심극한정리
- 표본크기 (n)가 증가함에 따라, 평균의 표본 분포가 정규 분포에 근사한다는 이론
- 동일한 확률분포를 가지는 확률변수로부터 추출된 n개의 표본평균은 n이 클수로 정규분포에 가까워 진다는 정리
- 추출된 n개의 표본 : 실험을 독립적으로 n번 진행했을때 표본
동전을 던져 앞면이 나올 확률을 R코드를 활용하여 계산해보자
library(ggplot2)
coins = c()
for (i in 1:10){
coin = sample(x =c("H","T"), size = 100, replace =TRUE)
#replace= True를ㄹ 활용하여 복원추출
probs = table(coin)/length(coin)
#앞면("H")과 뒷면("T")의 빈도를 계산
h_prob = probs["H"]
#앞면이 나올 확률 계산
coins[i]=h_prob
}
ggplot()+
geom_histogram(aes(x=coins),binwidth = 0.01)+
theme_bw()+
theme(legend.position ='bottom',
text = element_text(size =12,face='bold'))
for문을 100번 시행해서 앞면이 나올 확률
for문을 1000번 시행해서 앞면이 나올 확률
for문을 10000번 시행해서 앞면이 나올 확률
결과
- 표본수가 증가 할 수록 표본평균의 분포가 대칭구조를 가지는 종 모양에 근접
- 이 분포를 정규분포라고 정의
- 현실에서 데이터 분석은 모집단에 대한 정확한 분포를 모르고 분석을 진행해야 하는데 중심 극한 정리가 이문제를 해결해줌
- 중심극한 정리는 모집단의 분포를 모르는 상황에서도 다양한 통계이론을 전개 할 수 있는 근거를 마련
-> 중심극한정리는 표본의 크기가 충분히 크다면, 모집단의 분포가 무엇인지에 상관없이 표본평균의 분포가 대칭적인 종 모양인 정규분포에 근접한다는 원리이다.
이를 통해 현실에서 모집단의 분포를 정확히 알지 못해도 통계 분석을 수행할 수 있다.
중심극한정리는 통계학에서 중요한 개념으로서, 표본의 크기가 충분히 크다면 모집단의 분포를 모르는 상황에서도 표본평균이 정규분포에 근사한다는 것을 보장한다.
이는 통계적 추론을 할 때 유용하게 사용됩니다.
예를 들어, 가설 검정이나 신뢰구간을 구할 때, 표본 평균의 분포를 정규분포로 가정하고 분석을 진행할 수 있다.중심극한정리는 표본의 크기가 커질수록 정규분포에 근접하기 때문에, 통계 분석에서는 일반적으로 표본의 크기가 충분히 큰 경우를 가정하고 분석을 수행한다. 이를 통해 모집단에 대한 정확한 분포를 모르는 상황에서도 통계 이론을 전개할 수 있으며, 신뢰성 있는 결론을 도출할 수 있다.
-> 중심극한정리 예시상황
- 동전 던지기: 동전을 여러 번 던져서 앞면이 나올 확률을 추정하고자 할 때, 중심극한정리를 사용할 수 있다. 동전의 던지기는 베르누이 시행으로 볼 수 있으며, 표본의 크기가 충분히 클 경우, 동전의 앞면이 나올 확률의 분포가 정규분포에 근사한다고 가정할 수 있다.
- 투표 조사: 선거나 조사에서 특정 후보나 응답 항목에 대한 지지율을 추정하고자 할 때, 중심극한정리를 사용할 수 있다. 투표 조사는 이항 분포로 모델링될 수 있으며, 표본의 크기가 충분히 클 경우, 투표 결과의 분포가 정규분포에 근사한다고 가정할 수 있다.
- 제품 품질 테스트: 제조된 제품의 품질을 테스트하고자 할 때, 중심극한정리를 사용할 수 있다. 예를 들어, 제품의 중량을 측정하여 평균 중량을 추정하고자 할 때, 제품 중량의 분포가 정규분포에 근사한다고 가정할 수 있다.
- 인구 조사: 인구 조사에서 특정 인구 특성에 대한 평균 값을 추정하고자 할 때, 중심극한정리를 사용할 수 있다. 인구 조사는 대규모 표본을 사용하며, 표본의 크기가 충분히 클 경우, 인구 특성의 분포가 정규분포에 근사한다고 가정할 수 있다.
728x90
반응형
'수학 > 통계학' 카테고리의 다른 글
데이터분포 탐색하기 (분포의 치우침, 왜도,첨도) (0) | 2023.07.23 |
---|---|
연속형 확률분포(정규분포, 표준정규분포): 정규분포, 지수분포, 표준정규분포, 카이제곱,F분포 (0) | 2023.07.05 |
확률분포, 이산형확률분포(확률질량함수,베르누이시행) (0) | 2023.06.17 |
모수와 통계량(기댓값,모평균,표본평균,분산,편차) (0) | 2023.06.08 |
확률(경우의수, 순열,조합,중복순열,중복조합)+확률변수(시행,사건,확률변수, 확률함수) (0) | 2023.06.08 |