본문 바로가기

기초통계

[기초] 12. [R] 점추정과 구간추정 ## 작성일: 2017.10.01## 작성자: 춤추는 초코칩## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)## 5장 표본을 이용한 모수 추론## 5.3 점추정과 구간추정 모평균의 점추정량은 표본평균을 사용점추정은 추정량이 모수를 어느 정도 정확하게 추정했는지에 대한 정보는 알 수 없다구간추정은 점추정량에 대한 정확도를 포함한 추정방법 # 신뢰구간 함수 만들기fi 더보기
[기초] 11. [R] 동질성검정 ## 작성일: 2017.09.30## 작성자: 춤추는 초코칩## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)## 4장 범주형 데이터 분석## 4.5 동질성검정 동질성검정은 모집단이 여러 개의 부모집단으로 분할되어 있고, 각 부모집단이 몇 개의 버주로 나뉘어져 있을 때, 각 범주들이 부모집단에 의해서 동일한 비율로 나눠어져 있는가를 검정 # 성별에 따라 신용정도가 다른지 검정sex_credit 더보기
[기초] 10. [R] 독립성검정 ## 작성일: 2017.09.29## 작성자: 춤추는 초코칩## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)## 4장 범주형 데이터 분석## 4.4 독립성검정 독립성검정은 조사대상에 대하서 두 가지 범주형 변수에 대해서 서로 관련성이있는가를 검정하는 방법 # 성별과 흡연은 관련성이 있는가library("MASS")# 1) chisq.test(group1, group2)chisq.test(survey$Sex, survey$Smoke)# p.value가 0.3139(>=0.05)이므로 유의수준 5%로 귀무가설을 수락# 즉, 유의수준 5%로 성별과 흡연은 관련성이 없다고 할 수 있는 근거가 있다. # 2) use xtabscross_sex_smoke 더보기
[기초] 9. [R] 적합도검정 ## 작성일: 2017.09.28## 작성자: 춤추는 초코칩## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)## 4장 범주형 데이터 분석## 4.3 적합도검정 적합도검정은 관측도수가 주어진 이론적 분포를 따른다고 할 수 있는지를 검정하는 것 # 첫번째 예제. 주사위를 300번 던지는 시뮬레이션h0_prob 더보기
[기초] 8. [R] 막대그래프, 원그래프와 모자이크 그래프 ## 작성일: 2017.09.27## 작성자: 춤추는 초코칩## 4장 범주형 데이터 분석## 4.2 막대그래프, 원그래프와 모자이크 그래프 freq_ty 더보기
[기초] 7. [R]도수분포표, 분할표 ## 작성일: 2017.09.25## 작성자: 춤추는 초코칩## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)## 4장 범주형 데이터 분석## 4.1 도수분포표와 분할표 직접적으로 그려주지는 않음.자료를 가지고 표 형태로 작성해야함.(2017.09.27 추가) 기본 함수로 제공하고 있지 않으나, gmodels 패키지를 활용하여 분할표 작성가능그래프로 시각화하여 보여 주는 것이 좋을 듯함. library(MASS)str(Cars93) ## 도수분포표 # 도수 구하기freq_ty 더보기
[기초] 6. [엑셀]분산분석 1. ANOVA검정의 가정 - 모집단들은 등분산을 가진다: 균형적인 설계. 하틀리(Hartley) 검정을 이용하여 검정할 수 있음 - 모집단들은 정규분포이다: 정규분포의 가정에 대한 위배는 중심극한정리에 의해 크게 심각한 문제를 야기하지 않는다. - 관찰치는 서로 독립이다: 검정의 정확성에 크게 영향. 시계열자료의 경우 독립성의 가정이 위배될 가능성이 높음 2. 일원분류 분산분석(one-way classification ANOVA) - 3집단 이상의 평균차이 검정 - 예제. 자동차 회사의 연비 차이 * 데이터 탭 > 데이터 분석 > 분산 분석 : 일원 배치법 * p값이 유의수주(0.05)보다 작으므로 귀무가설을 기각하여 회사간 연비차이는 있는 것으로 나타났다. 3. 이원분류 분산분석(two-way cla.. 더보기
[기초] 5. [엑셀]카이제곱 검정 범주형 자료에 대한 카이제곱 검정 1. 적합성 검정 - 모비율에 대한 가정의 적합성 검정 - 단일 표본에 대한 적합도 검정 - 모든 범주의 기대도수의 값이 5이상일 경우에 사용가능 - 예제. 네 가지 제품에 대한 시장점유율이 p1은 0.2, p2는 0.3, p3은 0.4, p4는 0.1라는 것을 유의수준 0.05에서 검정 * 기대도수표를 그려서 CHISQ.TEST함수 사용 * p값은 0.002849로 유의수준보다 작으므로 귀무가설을 기각한다. 2. 독립성 검정 - 분할표(contingency table): 두 가지 기준에 의해 분류하여 작성된 도수분포표 - 기대빈도가 5 미만인 셀이 전체의 20%를 초과할 때에는 독립성 분석을 하지 않는 것이 좋다. 극복방안으로, * 빈도가 적은 셀은 제외한 뒤 분석 *.. 더보기