본문 바로가기

기초통계

[기초] 10. [R] 독립성검정

반응형

## 작성일: 2017.09.29

## 작성자: 춤추는 초코칩

## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)

## 4장 범주형 데이터 분석

## 4.4 독립성검정


 독립성검정은 조사대상에 대하서 두 가지 범주형 변수에 대해서 서로 관련성이있는가를 검정하는 방법


# 성별과 흡연은 관련성이 있는가

library("MASS")

# 1) chisq.test(group1, group2)

chisq.test(survey$Sex, survey$Smoke)

# p.value가 0.3139(>=0.05)이므로 유의수준 5%로 귀무가설을 수락

# 즉, 유의수준 5%로 성별과 흡연은 관련성이 없다고 할 수 있는 근거가 있다.


# 2) use xtabs

cross_sex_smoke <- xtabs(~survey$Sex+survey$Smoke,data=survey)

chisq.test(cross_sex_smoke)


# 3) use CrossTable{gmodels}

library(gmodels)

CrossTable(survey$Sex,survey$Smoke, chisq=TRUE)


# 성별과 선호하는 커피의 종류는 관련이 있는가

# 데이터 생성

coffee_sex <- matrix(c(23,57,99,30,42,86,124,39), nrow=2, byrow=TRUE)

rownames(coffee_sex) <- c("F","M")

colnames(coffee_sex) <- c("A","B","C","D")

# 모자이크 그래프

mosaicplot(coffee_sex, main="Mosaicplot of Coffee by Sex", xlab="Sex", ylab="Coffee")

# 독립성검정

chi_test_coffee <- chisq.test(coffee_sex)

chi_test_coffee

# p.value가 0.5687(>=0.05)이므로 유의수준 5%로 귀무가설을 수락

# 즉, 유의수준 5%로 성별과 선호하는 커피는 관련성이 없다고 할 수 있는 근거가 있다.



반응형