본문 바로가기

R 크롤링

[R크롤링] 3. R을 이용한 트위터 크롤링

반응형

## 작성일: 2017.12.10

## 작성자: 춤추는초코칩

## 참고문허: R과Java로 크롤링하자

## Part03 R을 활용하여 크롤링하기

## Chapter08 트위터 크롤링


# 트위터를 크롤링하기위해서 트위터 앱 사이트(http://apps.twitter.com)에서 Key값을 발급받아야 한다.

# Step1. 트위터에 로그인 후, http://apps.twitter.com에서 "Create New App"를 클릭


# Step2. Name, Description, Website 입력 후 동의(Yes, I have~) 부분을 체크한 후 "Create your Twitter application" 선택

# Name: Application 이름(32글자 이내)

# Description: Application에 대한 설명 입력(10~200 글자 이내)

# Website: 자신의  블로그 URL 주소나 다른 웹 사이트의 URL 주소를 입력


# Step3. Keys and Access Tokens 탭에서 Consumer Key(API Key), Consumer Secret(API Secret)을 확인

# "Create my access Token"을 선택


# Step4. 발급된 Access Token과 Access Token Secre 확인


# R 프로그램에서 아래 명령어 실행

# 작업폴더 경로 확인

getwd()

# 저장할 폴더 지정

setwd("D:/R/R과Java로 크롤링하자")

getwd()


# 패키지 인스톨

# install.packages(c("twitteR", "ROAuth", "base64enc"))

# 라이브러리 불러오기

library("twitteR")

library("ROAuth")

library("base64enc")


# 트위터 계정에서 발급받은 키 값을 입력

#consumerKey <- "Consumer Key (API Key)"

#consumerSecret <- "Consumer Secret (API Key)"

#AccessToken <- "Access Token"

#accessTokenSecret <- "Access Token Secret"

consumerKey <- "Consumer Key (API Key)"

consumerSecret <- "Consumer Secret (API Key)"

accessToken <- "Access Token"

accessTokenSecret <- "Access Token Secret"


# setup_twitter_oauth 함수를 사용해서 oauth 인증 파일 저장

setup_twitter_oauth(consumerKey, consumerSecret, accessToken, accessTokenSecret)

# 콘솔 창에 1(yes)를 선택한다.


# enc2utf8 함수를 사용하여 키워드 저장

keyword <-enc2utf8("빅데이터")


# 크롤링할 트위터 수(n=500)와 언어(lang="ko") 설정

bigdata <- searchTwitter(keyword, n=500, lang="ko")

# head 함수를 사용하여 bigdata에 저장된 내용의 앞부분 확인

head(bigdata)

# length 함수를 사용하여 bigdata에 저장된 트위터의 개수 확인

length(bigdata)


# 크롤링할 기간(since='2017-01-01', until='2017-12-31')을 설정

bigdata <- searchTwitter(keyword, since = '2017-01-01', until = '2017-12-31', lang="ko")

# head 함수를 사용하여 bigdata에 저장된 내용의 앞부분 확인

head(bigdata)

# length 함수를 사용하여 bigdata에 저장된 트위터의 개수 확인

length(bigdata)


반응형