## 작성일: 2017.10.08
## 작성자: 춤추는 초코칩
## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)
## 5장 표본을 이용한 모수 추론
## 5.6 모비율에 대한 추론
# 400명 중 320명이 새로운 메뉴를 선호한다
# 모비율에 대한 추론
prop.test(320, 400, alternative="greater", correct=FALSE)
# 이산형 자료를 연속형 자료의 분포인 정규분포를 이용하기 위해 연속성보정(correct=TRUE)
prop.test(320, 400, p=0.5, alternative="two.sided", correct=TRUE)
모비율의 점추정: 0.8
모비율의 신뢰구간: (0.7567015, 0.8374104)
모비율의 검정은 p값(2.2e-16)으로 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.
새로운 메뉴를 선호하는 비율이 0.5보다 크다고 할 수 있는 근거가 아주 강하다.
## 5.7 모분산에 대한 추론
# 관측값이 정규분포에서 추출한 랜덤표본
# 제과회사에서 포장애 내용물의 함량이 표준편차가 5g미만이면 공정이 안정적이라고 한다.
# 임의로 20개를 추출한 자료의 모분산에 대한 추론
x <- c(499,497,498,495,504,500,499,503,502,505,502,491,500,491,506,494,502,506,499,499)
# 표본이 정규분포에서 추출된 것인지 검정
shapiro.test(x)
p값(0.3177)으로 유의수준(0.05)보다 크므로 표본은 정규분포에서 추출된 것이라고 할 수 있다.
var_test_one <- function(x, sigma0, conf.level, alternative){
df <- length(x)-1
var_sample <- var(x)
chi_upper <- qchisq((1-conf.level)/2, df, lower.tail=FALSE)
chi_lower <- qchisq((1-conf.level)/2, df, lower.tail=TRUE)
lower_limit <- df*var_sample/chi_upper
upper_limit <- df*var_sample/chi_lower
chisq_statistic <- df*var_sample/sigma0^2
p_value_U <- pchisq(chisq_statistic, df, lower.tail=FALSE)
p_value_L <- pchisq(chisq_statistic, df, lower.tail=TRUE)
if(alternative=="Two_sided"){
if(2*p_value_U<1){
p_value <- 2*p_value_U
}else {
p_value <- 2*p_value_L
}
cat("chisq test for variance:", "\n")
}
else if(alternative=="greater"){
p_value <- p_value_U
cat("chisq test for variacne", "\n")
}
else{
p_value <- p_value_L
cat("chisq test for variance", "\n")
}
result <- ifelse(p_value<(1-conf.level), "Reject H0", "Accept H0")
cat("X_squared =", chisq_statistic, "\n")
cat("degree of freedom =", df, "\n")
cat("p_value =", p_value, "\n")
if(alternative=="two_sided"){
cat("alternative hypothesis: true variance is not ", sigma0^2, "\n")
} else if(alternative=="greater"){
cat("alternative hypothesis: true variance is greater than ", sigma0^2, "\n")
} else {
cat("alternative hypothesis: true variance is less than ", sigma0^2, "\n")
}
cat(conf.level*100, "% confidence interval :", lower_limit, upper_limit, "\n")
cat("sample estimate: variacne of x =", var_sample, "\n")
cat("result =", result)
}
conf.level <- .95
sigma0 <- 5
alternative <- "less"
var_test_one(x=x, sigma0=sigma0, conf.level=conf.level, alternative=alternative)
모분산의 점추정: 19.51579
모분산의 신뢰구간: (11.28687, 41.63244)
모분산의 검정은 p값(0.2667864)이 유의수준(0.05)보다 크므로 귀무가설을 수락한다.
내용물의 표준편차가 5g이라고 할 수 있는 근거가 있으므로 이 회사의 공정은 안정적이라고 할 수 있는 근거가 없다.
'기초통계' 카테고리의 다른 글
[기초] 17. [R] 짝진 모집단의 평균 비교(쌍체비교) (0) | 2017.10.09 |
---|---|
[기초] 16. [R] 두 독립 모집단의 평균 비교 (0) | 2017.10.09 |
[기초] 14. [R] 모평균에 대한 추론:샤피로-윌크 검정 (0) | 2017.10.07 |
[기초] 13. [R] 모평균에 대한 추론:콜모고로프-스미르노프 검정 (0) | 2017.10.06 |
[기초] 12. [R] 점추정과 구간추정 (0) | 2017.10.01 |