본문 바로가기

기초통계

[기초] 15. [R] 모비율, 모분산에 대한 추론

반응형

## 작성일: 2017.10.08

## 작성자: 춤추는 초코칩

## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)

## 5장 표본을 이용한 모수 추론

## 5.6 모비율에 대한 추론


# 400명 중 320명이 새로운 메뉴를 선호한다

# 모비율에 대한 추론

prop.test(320, 400, alternative="greater", correct=FALSE)

# 이산형 자료를 연속형 자료의 분포인 정규분포를 이용하기 위해 연속성보정(correct=TRUE)

prop.test(320, 400, p=0.5, alternative="two.sided", correct=TRUE)

모비율의 점추정: 0.8

모비율의 신뢰구간: (0.7567015, 0.8374104)

모비율의 검정은 p값(2.2e-16)으로 유의수준(0.05)보다 작으므로 귀무가설을 기각한다.

새로운 메뉴를 선호하는 비율이 0.5보다 크다고 할 수 있는 근거가 아주 강하다.


## 5.7 모분산에 대한 추론

# 관측값이 정규분포에서 추출한 랜덤표본

# 제과회사에서 포장애 내용물의 함량이 표준편차가 5g미만이면 공정이 안정적이라고 한다.

# 임의로 20개를 추출한 자료의 모분산에 대한 추론

x <- c(499,497,498,495,504,500,499,503,502,505,502,491,500,491,506,494,502,506,499,499)

# 표본이 정규분포에서 추출된 것인지 검정

shapiro.test(x)

p값(0.3177)으로 유의수준(0.05)보다 크므로 표본은 정규분포에서 추출된 것이라고 할 수 있다.

var_test_one <- function(x, sigma0, conf.level, alternative){

  df <- length(x)-1

  var_sample <- var(x)

  chi_upper <- qchisq((1-conf.level)/2, df, lower.tail=FALSE)

  chi_lower <- qchisq((1-conf.level)/2, df, lower.tail=TRUE)

  lower_limit <- df*var_sample/chi_upper

  upper_limit <- df*var_sample/chi_lower

  chisq_statistic <- df*var_sample/sigma0^2

  p_value_U <- pchisq(chisq_statistic, df, lower.tail=FALSE)

  p_value_L <- pchisq(chisq_statistic, df, lower.tail=TRUE)

  if(alternative=="Two_sided"){

    if(2*p_value_U<1){

      p_value <- 2*p_value_U

    }else {

      p_value <- 2*p_value_L

    }

    cat("chisq test for variance:", "\n")

  }

  else if(alternative=="greater"){

    p_value <- p_value_U

    cat("chisq test for variacne", "\n")

  }

  else{

    p_value <- p_value_L

    cat("chisq test for variance", "\n")

  }

  result <- ifelse(p_value<(1-conf.level), "Reject H0", "Accept H0")

  cat("X_squared =", chisq_statistic, "\n")

  cat("degree of freedom =", df, "\n")

  cat("p_value =", p_value, "\n")

  if(alternative=="two_sided"){

    cat("alternative hypothesis: true variance is not ", sigma0^2, "\n")

  } else if(alternative=="greater"){

    cat("alternative hypothesis: true variance is greater than ", sigma0^2, "\n")

  } else {

    cat("alternative hypothesis: true variance is less than ", sigma0^2, "\n")

  }

  cat(conf.level*100, "% confidence interval :", lower_limit, upper_limit, "\n")

  cat("sample estimate: variacne of x =", var_sample, "\n")

  cat("result =", result)

}

conf.level <- .95

sigma0 <- 5

alternative <- "less"

var_test_one(x=x, sigma0=sigma0, conf.level=conf.level, alternative=alternative)

모분산의 점추정: 19.51579

모분산의 신뢰구간: (11.28687, 41.63244)

모분산의 검정은 p값(0.2667864)이 유의수준(0.05)보다 크므로 귀무가설을 수락한다.

내용물의 표준편차가 5g이라고 할 수 있는 근거가 있으므로 이 회사의 공정은 안정적이라고 할 수 있는 근거가 없다.

반응형