수학/통계학

구간추정하기:신뢰구간

윤채니챈 2023. 8. 2. 20:55
728x90
반응형

구간추정

- 표본을 활용해 모집단을 추정하는 과정

 

 

신뢰구간

 - 모평균을 구간 추정할 때는 표본평균을 기준으로 하고, 그 주변에 오차범위를 더하거나 빼서 신뢰구간을 구한다.

신뢰구간 = (평균 - 1.96 * 표준편차, 평균 + 1.96 * 표준편차)

 

P(-zα/2 ≤ Z ≤ zα/2) = 1 - α

P(-zα/2 ≤ X - μ ≤ zα/2) = 1 - α/σ

P(X - zσ ≤ μ ≤ X + zσ) = 1 - α*(σ/n)*zα/2

 

  • 𝑝(−𝑧𝛼/2 ≤ 𝑍 ≤ 𝑧𝛼/2)=1 − 𝛼: 이 공식은 표준정규분포를 따르는 확률변수 𝑍에 대한 신뢰구간을 나타냅니다. 𝑍는 표준화된 표본평균이고, 𝛼는 유의수준입니다. 𝑧𝛼/2는 표준정규분포에서 양쪽 꼬리에 있는 확률이 𝛼/2인 점의 𝑧값입니다. 예를 들어, 95% 신뢰수준에서 𝛼=0.05이고, 𝑧0.025=1.96입니다.
  • 𝑝(−𝑧𝛼/2 ≤ 𝑋−𝜇 ≤ 𝑧𝛼/2)=1 − 𝛼: 이 공식은 모집단의 분산이 알려져 있고, 표본의 크기가 충분히 큰 경우에 모평균을 구하는 신뢰구간을 나타냅니다. 𝜇는 모평균이고, 𝜎는 모집단의 표준편차입니다. 𝑋는 표본평균이고, 𝑛은 표본의 크기입니다.
  • 𝑝(𝑋−𝑧𝜎/√𝑛 ≤𝜇≤𝑋+𝑧𝜎/√𝑛)=1−𝛼: 이 공식은 위의 공식을 정리한 것입니다. 신뢰구간의 하한과 상한을 구하기 위해, 표본평균에 오차범위를 더하거나 빼줍니다. 오차범위는 𝑧𝜎/√𝑛으로 계산됩니다.

신뢰구간은 표본의 크기, 모집단의 분산, 신뢰수준에 따라 달라진다.

***신뢰수준이란: 구간 추정이 얼마나 정확한지를 나타내는 확률.

- 95% 신뢰수준이라면, 100번의 구간 추정 중 95번은 모수가 신뢰구간 안에 있을 것이라는 의미.

- 예를 들어, 95% 신뢰수준이라면, 100번의 구간 추정 중 95번은 모수가 신뢰구간 안에 있을 것이라는 의미

 

 

평균이 5이고 표준편차가 2인 정규분포의 95%신뢰구간은?

신뢰구간 = (5 - 1.96 * 2, 5 + 1.96 * 2)
= (5 - 3.92, 5 + 3.92)
= (1.08, 8.92)

따라서, 해당 정규분포의 95% 신뢰구간은 (1.08, 8.92)

평균이 5이고 표준편차가 2인 정규분포의 95%신뢰구간

# 필요한 라이브러리 로드
library(ggplot2)

# 평균과 표준편차를 지정합니다.
mean_value <- 5
standard_deviation <- 2

# 95% 신뢰구간 계산
confidence_level <- 0.95
z_score <- qnorm((1 + confidence_level) / 2)  # 95% 신뢰수준을 위한 Z-score 계산
lower_bound <- mean_value - z_score * standard_deviation
upper_bound <- mean_value + z_score * standard_deviation

# 정규분포 데이터 생성
x <- seq(mean_value - 4 * standard_deviation, mean_value + 4 * standard_deviation, length.out = 100)
y <- dnorm(x, mean_value, standard_deviation)

# 데이터프레임 생성
df <- data.frame(x = x, y = y)

# 그래프 그리기
ggplot(df, aes(x = x, y = y)) +
  geom_line() +
  geom_area(data = subset(df, x >= lower_bound & x <= upper_bound), fill = "blue", alpha = 0.2) +
  xlab("X") +
  ylab("Density") +
  ggtitle("평균이 5이고 표준편차가 2인 정규분포의 95% 신뢰구간") +
  theme_minimal()
728x90
반응형