## 작성일: 2017.10.07
## 작성자: 춤추는 초코칩
## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)
## 5장 표본을 이용한 모수 추론
## 5.5 모평균에 대한 추론
# 평균이 mu, 분산이 sigma^2인 모집단에서 추출한 랜덤표본
# n이 충분히 크면 표본평균은 근사적으로 평균이 mu, 표준편차가 sigma^2/n인 정규분포를 따른다
# 10에서 19까지 정수로 이루어진 모집단에서 크기가 5개인 랜덤표본 500개의 평균에 대한 분포
clt <- function(x,n,replace){
sample_clt <- sample(x,n,replace)
Mean <- mean(sample_clt)
}
x <- c(10:19)
n <- 5
replace <- TRUE
set.seed(4567)
sample_mean_clt <- replicate(500,clt(x,n,replace))
Mean_pop <- mean(x)
Sd_pop <- sqrt(sum((x-mean(x))^2)/10)
# 정규분포
norm_3 <- function(sample_mean_clt){
dnorm(sample_mean_clt, Mean_pop, Sd_pop/sqrt(n))
}
# 표본평균의 분포와 정규분포 비교하기
plot(density(sample_mean_clt), lty=2, main="Density of Sample_mean")
curve(norm_3, from=min(sample_mean_clt), to=max(sample_mean_clt), add=TRUE)
legend(x=16.2, y=0.3, c("sample_mean", "N(14.5,8.25/10)"), lty=c(2,1))
이산확률분포에서 추출한 랜덤표본이 정규분포에 근접한다는 것을 확인할 수 있다.
표본의 크기가 커질수록 평균의 분포는 정규분포에 더 가까운 형태가 된다.
## (2) 샤피로 윌크 검정(Shapiro-Wilk Test)
# 시제품 20개의 전구수명이 평균이 10,000시간, 표준편차가 10시간인 정규분포를 따르는지 검정
library("TeachingDemos") #z.test를 위한 패키지
obs <- c(10188,10197,10211,10201,10187,10199,10214,10189,10209,10193,10189,10213,10199,10203,10198,10203,10204,10219,10201,10205)
boxplot(obs, horizontal=TRUE)
shapiro.test(obs)
z.test(obs, mu=10000, stdev=10, alternative="greater")
z.test(obs, mu=10000, stdev=10, alternative="two.sided")
정규성검정에서 p값(0.6136)이 유의수준(0.05)보다 크므로 표본이 정규분포를 따른다고 할 수 있는 근거가 아주 강하다.
표준편차가 알려져 있기 때문에 정규분포를 이용하여 모평균에 대한 추론을 할 수 있다.
단측검정결과 p값(<2.2e-16)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.
새로운 전구의 수명이 10,000시간보다 크다는 대립가설을 수락할 수 있는 근거가 아주 강하다.
양측검정결과 p값(<2.2e-16)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.
새로운 전구의 수명이 10,000시간이 아니라는 대립가설을 수락할 수 있는 근거가 아주 강하다.
# sigma가 알려져 있지 않을 때에는 자유도가 n-1인 t-분포를 따른다.
# 에어로빅 전후 체즁의 변화량이 정규분포를 따르는지 검정
weight_diff <- c(1.5,1.0,0.7,1.2,0.9,0.0,0.7,-0.4,0.7,0.3,2.8,0.9,1.4,-0.4,-1.1,0.8,1.8,1.9,1.3,-0.2)
boxplot(weight_diff, horizontal=TRUE)
shapiro.test(weight_diff)
t.test(weight_diff,mu=0, alternative="greater")
t.test(weight_diff,mu=0, alternative="two.sided")
정규성검정에서 p값(0.9478)이 유의수준(0.05)보다 크므로 표본이 정규분포를 따른다고 할 수 있는 근거가 아주 강하다.
표준편차가 알려져 있지 않고 표본의 크기도 작기 때문에 t분포를 이용하여 모평균에 대한 추론을 할 수 있다.
단측검정결과 p값(0.0005305)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.
체중의 차이가 0보다 크다는 대립가설을 수락할 수 있는 근거가 아주 강하다
양측검정결과 p값(0.001061)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.
체중의 차이가 있다는 대립가설을 수락할 수 있는 근거가 아주 강하다.
'기초통계' 카테고리의 다른 글
[기초] 16. [R] 두 독립 모집단의 평균 비교 (0) | 2017.10.09 |
---|---|
[기초] 15. [R] 모비율, 모분산에 대한 추론 (0) | 2017.10.08 |
[기초] 13. [R] 모평균에 대한 추론:콜모고로프-스미르노프 검정 (0) | 2017.10.06 |
[기초] 12. [R] 점추정과 구간추정 (0) | 2017.10.01 |
[기초] 11. [R] 동질성검정 (0) | 2017.09.30 |