본문 바로가기

기초통계

[기초] 14. [R] 모평균에 대한 추론:샤피로-윌크 검정

반응형

## 작성일: 2017.10.07

## 작성자: 춤추는 초코칩

## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)

## 5장 표본을 이용한 모수 추론

## 5.5 모평균에 대한 추론


# 평균이 mu, 분산이 sigma^2인 모집단에서 추출한 랜덤표본

# n이 충분히 크면 표본평균은 근사적으로 평균이 mu, 표준편차가 sigma^2/n인 정규분포를 따른다

# 10에서 19까지 정수로 이루어진 모집단에서 크기가 5개인 랜덤표본 500개의 평균에 대한 분포

clt <- function(x,n,replace){

  sample_clt <- sample(x,n,replace)

  Mean <- mean(sample_clt)

}

x <- c(10:19)

n <- 5

replace <- TRUE

set.seed(4567)

sample_mean_clt <- replicate(500,clt(x,n,replace))

Mean_pop <- mean(x)

Sd_pop <- sqrt(sum((x-mean(x))^2)/10)

# 정규분포

norm_3 <- function(sample_mean_clt){

  dnorm(sample_mean_clt, Mean_pop, Sd_pop/sqrt(n))

}

# 표본평균의 분포와 정규분포 비교하기

plot(density(sample_mean_clt), lty=2, main="Density of Sample_mean")

curve(norm_3, from=min(sample_mean_clt), to=max(sample_mean_clt), add=TRUE)

legend(x=16.2, y=0.3, c("sample_mean", "N(14.5,8.25/10)"), lty=c(2,1))

이산확률분포에서 추출한 랜덤표본이 정규분포에 근접한다는 것을 확인할 수 있다.

표본의 크기가 커질수록 평균의 분포는 정규분포에 더 가까운 형태가 된다.


## (2) 샤피로 윌크 검정(Shapiro-Wilk Test)

# 시제품 20개의 전구수명이 평균이 10,000시간, 표준편차가 10시간인 정규분포를 따르는지 검정

library("TeachingDemos") #z.test를 위한 패키지

obs <- c(10188,10197,10211,10201,10187,10199,10214,10189,10209,10193,10189,10213,10199,10203,10198,10203,10204,10219,10201,10205)

boxplot(obs, horizontal=TRUE)

shapiro.test(obs)

z.test(obs, mu=10000, stdev=10, alternative="greater")

z.test(obs, mu=10000, stdev=10, alternative="two.sided")

정규성검정에서 p값(0.6136)이 유의수준(0.05)보다 크므로 표본이 정규분포를 따른다고 할 수 있는 근거가 아주 강하다.

표준편차가 알려져 있기 때문에 정규분포를 이용하여 모평균에 대한 추론을 할 수 있다.

단측검정결과 p값(<2.2e-16)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.

새로운 전구의 수명이 10,000시간보다 크다는 대립가설을 수락할 수 있는 근거가 아주 강하다.

양측검정결과 p값(<2.2e-16)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.

새로운 전구의 수명이 10,000시간이 아니라는 대립가설을 수락할 수 있는 근거가 아주 강하다.


# sigma가 알려져 있지 않을 때에는 자유도가 n-1인 t-분포를 따른다.

# 에어로빅 전후 체즁의 변화량이 정규분포를 따르는지 검정

weight_diff <- c(1.5,1.0,0.7,1.2,0.9,0.0,0.7,-0.4,0.7,0.3,2.8,0.9,1.4,-0.4,-1.1,0.8,1.8,1.9,1.3,-0.2)

boxplot(weight_diff, horizontal=TRUE)

shapiro.test(weight_diff)

t.test(weight_diff,mu=0, alternative="greater")

t.test(weight_diff,mu=0, alternative="two.sided")

정규성검정에서 p값(0.9478)이 유의수준(0.05)보다 크므로 표본이 정규분포를 따른다고 할 수 있는 근거가 아주 강하다.

표준편차가 알려져 있지 않고 표본의 크기도 작기 때문에 t분포를 이용하여 모평균에 대한 추론을 할 수 있다.

단측검정결과 p값(0.0005305)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.

체중의 차이가 0보다 크다는 대립가설을 수락할 수 있는 근거가 아주 강하다

양측검정결과 p값(0.001061)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.

체중의 차이가 있다는 대립가설을 수락할 수 있는 근거가 아주 강하다.


반응형