수학/통계학
구간추정하기:신뢰구간
윤채니챈
2023. 8. 2. 20:55
728x90
반응형
구간추정
- 표본을 활용해 모집단을 추정하는 과정
신뢰구간
- 모평균을 구간 추정할 때는 표본평균을 기준으로 하고, 그 주변에 오차범위를 더하거나 빼서 신뢰구간을 구한다.
신뢰구간 = (평균 - 1.96 * 표준편차, 평균 + 1.96 * 표준편차)
P(-zα/2 ≤ Z ≤ zα/2) = 1 - α
P(-zα/2 ≤ X - μ ≤ zα/2) = 1 - α/σ
P(X - zσ ≤ μ ≤ X + zσ) = 1 - α*(σ/n)*zα/2
- 𝑝(−𝑧𝛼/2 ≤ 𝑍 ≤ 𝑧𝛼/2)=1 − 𝛼: 이 공식은 표준정규분포를 따르는 확률변수 𝑍에 대한 신뢰구간을 나타냅니다. 𝑍는 표준화된 표본평균이고, 𝛼는 유의수준입니다. 𝑧𝛼/2는 표준정규분포에서 양쪽 꼬리에 있는 확률이 𝛼/2인 점의 𝑧값입니다. 예를 들어, 95% 신뢰수준에서 𝛼=0.05이고, 𝑧0.025=1.96입니다.
- 𝑝(−𝑧𝛼/2 ≤ 𝑋−𝜇 ≤ 𝑧𝛼/2)=1 − 𝛼: 이 공식은 모집단의 분산이 알려져 있고, 표본의 크기가 충분히 큰 경우에 모평균을 구하는 신뢰구간을 나타냅니다. 𝜇는 모평균이고, 𝜎는 모집단의 표준편차입니다. 𝑋는 표본평균이고, 𝑛은 표본의 크기입니다.
- 𝑝(𝑋−𝑧𝜎/√𝑛 ≤𝜇≤𝑋+𝑧𝜎/√𝑛)=1−𝛼: 이 공식은 위의 공식을 정리한 것입니다. 신뢰구간의 하한과 상한을 구하기 위해, 표본평균에 오차범위를 더하거나 빼줍니다. 오차범위는 𝑧𝜎/√𝑛으로 계산됩니다.
신뢰구간은 표본의 크기, 모집단의 분산, 신뢰수준에 따라 달라진다.
***신뢰수준이란: 구간 추정이 얼마나 정확한지를 나타내는 확률.
- 95% 신뢰수준이라면, 100번의 구간 추정 중 95번은 모수가 신뢰구간 안에 있을 것이라는 의미.
- 예를 들어, 95% 신뢰수준이라면, 100번의 구간 추정 중 95번은 모수가 신뢰구간 안에 있을 것이라는 의미
평균이 5이고 표준편차가 2인 정규분포의 95%신뢰구간은?
신뢰구간 = (5 - 1.96 * 2, 5 + 1.96 * 2)
= (5 - 3.92, 5 + 3.92)
= (1.08, 8.92)
따라서, 해당 정규분포의 95% 신뢰구간은 (1.08, 8.92)
# 필요한 라이브러리 로드
library(ggplot2)
# 평균과 표준편차를 지정합니다.
mean_value <- 5
standard_deviation <- 2
# 95% 신뢰구간 계산
confidence_level <- 0.95
z_score <- qnorm((1 + confidence_level) / 2) # 95% 신뢰수준을 위한 Z-score 계산
lower_bound <- mean_value - z_score * standard_deviation
upper_bound <- mean_value + z_score * standard_deviation
# 정규분포 데이터 생성
x <- seq(mean_value - 4 * standard_deviation, mean_value + 4 * standard_deviation, length.out = 100)
y <- dnorm(x, mean_value, standard_deviation)
# 데이터프레임 생성
df <- data.frame(x = x, y = y)
# 그래프 그리기
ggplot(df, aes(x = x, y = y)) +
geom_line() +
geom_area(data = subset(df, x >= lower_bound & x <= upper_bound), fill = "blue", alpha = 0.2) +
xlab("X") +
ylab("Density") +
ggtitle("평균이 5이고 표준편차가 2인 정규분포의 95% 신뢰구간") +
theme_minimal()
728x90
반응형