본문 바로가기

기초통계

[기초] 18. [R] 두 모비율의 비교

반응형

## 작성일: 2017.10.11

## 작성자: 춤추는 초코칩

## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)

## 6장 두 집단 비교에 관한 추론

## 6.3 두 모비율의 비교


## 모집단이 성공과 실패 두 종류로 이루어진 두 모집단을 비교

# 예. 두 공정의 불량률, 두 지역의 찬성률, 두 지역의 투표율, 두 지역의 판매비율

# 예제. 두지역의 원두 선호도 비율 비교

region_beans <- matrix(c(160,40,175,125), nrow=2, byrow=TRUE)

rownames(region_beans) <- c("region 1", "region 2")

colnames(region_beans) <- c("coffee_beans A", "coffee_beans B")

region_beans_prop <- prop.table(region_beans, margin=1)

barplot(region_beans_prop, col=c("red","blue"), beside=TRUE)

legend(x=5, y=0.7, c("region 1", "region 2"), fill=c("red","blue"))

mosaicplot(region_beans_prop, xlab="beans ration by region", main="")

막대그래프와 모자이크그래프를 살펴보면 region 2보다 region 1에서 A원두를 더 선호할 것으로 예상해 볼 수 있다.


prop.test(region_beans, p=NULL, alternative="two.sided", correct=FALSE)

prop.test(region_beans, p=NULL, alternative="two.sided", correct=TRUE)

모비율의 차이에 대한 점추정: 0.8000000, 0.5833333

모비율의 차이에 대한 구간추정: (0.1338523, 0.2994810)

이산형 자료를 연속형 확률분포로 분석하기 위해 연속성을 보정(correct=TRUE)한 결과에 대해 구간추정 실시

신뢰구간에 0이 포함되지 않기 때문에 두 지역에서 원두 A를 선호하는 비율이 다르다고 예측할 수 있다.

모비율의 차이에 대한 검정은 p값(7.4e-07)이 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.

두 지역에서 원두A를 선호하는 비율에 차이가 있다고 할 수 있는 근거가 강하다.

막대그래프와 모자이크그래프를 보면 region 2보다 region 1에서 A원두를 더 선호할 것으로 짐작할 수 있다.

반응형