본문 바로가기

분석

[R] 디아블로3 API(6): 직업별 상위 100위 아이템 히스토그램 ##작성자: 춤추는초코칩##작성일: 2018-03-24##작성내용: 직업별 분포 구하기 첫번째날: 디아블로3 개발자 사이트 가입하기두번재날: 바바리안 랭커 배틀태그, 히어로아이디 수집하기세번째날: 바바리안 1위 랭커 아이템 확인하기네번째날: 바바리안 상위 100위 랭커 세팅 분포 확인하기다섯번째날: 직업별 대균열 순위 분포도 지난 시간에 404 에러 확인하는 함수를 찾지 못해서 잠깐 옆길로 새서 직업별 대균열 순위를 알아 봤습니다.구글링 결과 R에서 404 에러를 확인하는 방법을 검색해보니 "httr" 라이브러리를 찾았습니다.https://stackoverflow.com/questions/23139357/how-to-determine-if-a-url-object-in-r-base-package-retur.. 더보기
[R] 디아블로3 API를 활용하여 직업별 상위 랭킹 세팅 분포 구하기 다섯번째날 ##작성자: 춤추는초코칩##작성일: 2018-03-23##작성내용: 직업별 대균열 순위 분포도 첫번째날: 디아블로3 개발자 사이트 가입하기두번째날: 바바리안 랭커 배틀태그, 히어로아이디 수집하기세번째날: 바바리안 1위 랭커 아이템 확인하기네번째날: 바바리안 상위 100위 랭커 세팅 분포 확인하기 원래대로라면... 직업별 상위 랭커 세팅 분포를 확인해야 했지만의외로 404에러로 페이지를 못찾는 경우가 발생했습니다.처리방법은 지금 생각 중이라, 그 사이에 대균열 순위 분포도를 그려보기로 했습니다. 공식홈페이지에서 순위 페이지에서 대균열 순위에 해당하는 "cell-RiftLevel"이라는 클래스가 있습니다.이를 활용하여, R에서 다음과 같은 사용자 정의 함수를 짰습니다. rank.function 더보기
[R] 디아블로3 API를 활용하여 직업별 상위 랭킹 세팅 분포 구하기 두번째날 ##작성자: 춤추는초코칩##작성일: 2018-03-12##작성내용: 바바리안 랭커 배틀태그, 히어로아이디 수집하기 두번째날인데... 첫번째날이 지나고 한참되었네요. ^^;;오늘 할일은 시즌 대균열 상위 랭커들의 배틀태그(Battletag)랑 영웅의 ID를 가지고 오는 작업입니다.배틀태그와 ID정보가 있으면, 해당 캐릭터가 가지고 있는 아이템 정보를 api를 통해 가지고 올 수 있습니다.디아블로3 웹페이지에서 스크래핑 해 보겠습니다. 필요한 패키지는 "rvest"입니다.library(rvest) 디아블로3 공식 홈페이지에서 대균열 순위가나오는 홈페이지 주소를 가지고 옵니다.배틀태그와 ID는 하이퍼링크 주소에 나와 있습니다. "battletag" 클래스에 "href" 주소를 가지고 오면 될거 같습니다.##D.. 더보기
선형혼합모형(LMM): 이원배치의 변량모형 ** 작성일: 2018.01.09** 작성자: 춤추는초코칩** 참고문헌: SPSS를 활용한 일반선형모형(GLM) 및 일반화선형혼합모형(GLMN), 학현사 SPSS에서 반복이 있는 이원배치 분산분석에 대해 알아보자. 분산분석의 요인이 모두 변량요인일때, 분산분석의 모형을 '변량모형'이라고 한다.다음의 표는 변량요인 A, 변량요인 B, 반복 수가 2인 이원배치의 데이터이다. 1. 데이터 입력SPSS에서 데이터는 다음과 같이 입력한다.변수의 설정의 다음과 같다. 2. 통계 처리분석방법은 [분석]>[혼합모형]>[선형]을 클릭한다.다음화면에서 [계속]을 클릭한다. 종속변수에 '측정치'를 요인에 '변량A', '변량B'를 등록한다. [임의]을 클릭하고 '변량A', '변량B'를 요인으로 '변량A*변량B'를 교호작용으로.. 더보기
[회귀분석] 2. [R] 회귀계수의 추론 ## 작성일: 2017.11.26## 작성자: 춤추는 초코칩## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)## 9장 회귀분석## 9.1 단순선형회귀분석 대학졸업자의 근무연수와 연봉과의 관계에서 회귀계수의 신뢰구간을 구해보자. t value는 회귀계수가 0인지 0이 아닌지를 검정하기 위한 검정통계량 값이다. 절편의 p value는 5.59e-06이고, 기울기의 p value는 1.25e-13으로, 절편과 기울기 모두 유의수준 0.001에서 귀무가설을 기각한다. 절편과 기울기 모두 0이 아니라는 근거가 아주 강하다. 절편(β0)의 95% 신뢰구간은 (168.82952, 335.92018)이고,기울기(β1)의 신뢰구간은 (38.34491, 47.50005)이다. ## 데이터year 더보기
9. 지수평활법 1. 지수평활법(Exponential Smoothing Method)- 비교적 단순한 시계열분석방법- 확률적인 변동을 없애버리는 것- 관측된 시계열 네에 명백히 드러나는 패턴을 이용하여 미래값을 예측 2. 미래값 예측시 고려사항- 가장 최근 관측된 값- 수준(또는 전반적인 평균)- 추세(또는 기울기)- 계절적인 평균 3. 예측접근방법- 과거 자료를 무시하고 가장 최근 관측값에 지속되는 관측값으로 예측 : 양의 시계열상관이 앞에 주어진 여러 패턴들을 압도할 때- 가장 최근 관측값을 무시하고 시계열의 평균, 추세, 계절성에 근거하여 예측 : 시계열상관을 무시할 만큼 시점이 충분히 길 때 4. 지수평활법 종류- 단순지수평활법(Single Smoothing with 1 parameter)- 이중지수평활법(dou.. 더보기
6. 백색잡음의 독립성 ARIMA 모형에서 통계적 적절성을 점검하는 데 가장 중요한 검정은 백색잡음의 독립성 여부 백색잡음의 독립성 확인방법 1. 잔차 편자기상관함수(residual acf)- 모든 잔차 자기상관계수는 이론적으로 '0'- 표본오차 때문에 최소 몇 개의 잔차 자기상관계수는 '0'이 아님 2. t-검정통계량- 단기시차(1,2,3)에서 '1.25', 그 밖의 시차에서 '1.6이하' 3. Box와 Ljung의 카이제곱검정 기타 진단 방법 1. 잔차도표(residual plot)- 특정 패턴을 발견할 수 없으며, 임의뢰 흩어져 있다면 잔차의 독립성과 등분산성을 만족함을 시각적으로 확인- 월등히 크거나 작은 값은 잘못 기재했거나 특이한 사건을 이해 개입모형(intervention model) 적용을 고려 2. 과도적합(o.. 더보기
4. 자기상관함수와 편자기상관함수의 형태 자기상관함수(ACF) 1)자기회귀(AR) 프로세스 경우 : 지수함수 또는 사인곡선 형태로 서서히 '0'으로 감소 2)이동평균(MA) 프로세스 경우 : 이동평균 차수에 해당하는 시차에 두드러진 스파이크, 이 시차 이후에는 모두 '0'으로 절단 3)두 프로세스가 혼합되어 있는 경우 : '0'을 향해 서서히 감소 편자기상관함수(PACF) 1)자기회귀(AR) 프로세스 경우 : 자기회귀 차수에 해당하는 시차에 두드러진 스파이크, 이 시차 이후에는 모두 '0'으로 절단 2)이동평균(MA) 프로세스 경우 : 지수함수 또는 사인곡선 형태롤 서서히 '0'으로 감소 3)두 프로세스가 혼합되어 있는 경우 : '0'을 향해 서서히 감소 * 첫 5개~7개 시차까지 추정된 자기상관계수들이 '0'을 향해 서서히 감소하는 패턴이면 .. 더보기