통계적 의사결정
통계적 의사결정
가설검정
- 데이터 분석에서 중요한 이론적 도구
- 연구자나 데이터 분석가가 분석의 구체적인 목적을 설정하고, 그 목적을 검증하기 위해 사용하는 절차
- 가설검정은 통계적 추론을 수행하여 데이터로부터 얻은 결과가 우연에 의한 것인지 아니면 실제로 의미 있는 패턴이나 차이를 나타내는지를 확인하는데 사용
가설의 두가지 종류
귀무가설: 기본적으로 참으로 여겨지는 가설로, 어떤 차이나 효과가 없다고 가정
ex)광고로 인한 매출상승은없음
대립가설: 연구자가 검증하고자 하는 가설로, 귀무가설이 거짓이라고 가정하며, 데이터로부터 특정한 차이나 효과를 지지하는 증거를 찾는다
ex) 광고로인한 매출상승 존재
-> 가설검증은 귀무가설을 사실이라 가정한 후 귀무가설이 틀렸는지 증거를 찾는 과정
1종오류, 2종오류
- 1종 오류(α): 귀무가설이 참임에도 불구하고 귀무가설을 기각하는 오류 ,실제로는 차이나 효과가 없는데도 데이터로 인해 차이가 있다고 잘못 결론을 내리는 경우.
- 2종 오류(β): 귀무가설이 거짓임에도 불구하고 귀무가설을 채택하는 오류, 실제로 차이나 효과가 있는데도 데이터로 인해 차이가 없다고 잘못 결론을 내리는 경우.
귀무가설이 사실(차이x) | 대립가설이 사실(차이0) | |
귀무가설이 맞음 | 옳은결정 | 1종오류 |
귀무가설이 틀림 | 2종오류 | 옳은결정 |
1종오류, 2종오류 출처 블로그
https://velog.io/@73syjs/%EA%B0%80%EC%84%A4-%EA%B2%80%EC%A0%95%EC%9D%98-%EC%98%A4%EB%A5%98
가설 검정의 오류
Type of Error
velog.io
예시)
1종오류: 환자가 양성인경우 음성으로 판단내리는 경우
2종오류: 환자가 음성인경우 양성으로 판단내리는경우
trade off :하나의 오류를 감소시키면 다른오류 증가
-> 1종오류의 경우 cost가 더 큰 오류이기때문에 최대한 작게 설정하려고한다 -> 1종오류를 줄이기위해 임계값을 β 쪽으로 옮길경우 2종오류의 임계값이 커지게 된다
제1종오류,제2종오류 모두 오류이기때문에 높은 값을 갖는것은 좋지않으며 표본이 고정되어있는 상황에서는 오류를 동시에 줄이는 방법은 없음
유의수준: 가설검정에서는 귀무가설의 제1종오류의 허용한계를 정해야하는데, 이때 제 1종오류를 허용할 최대의 확률(1종오류를 최대한 작게해야하는것이 중요하기때문)
신뢰수준,신뢰구간: 유의수준이 0.05인 상황의미
ex)95%유의수준: 표본으로 계산한 신뢰구간이 모수를 포함할 확률이 95%