반응형
## 작성일: 2017.12.16
## 작성자: 춤추는초코칩
## 네이버 증권에서 삼성전자 일별 시세 가져오기
# 작업폴더 경로 확인
getwd()
# 저장할 폴더 지정
setwd("D:/R/R과Java로 크롤링하자")
getwd()
# 패키지 인스톨
# install.packages("rvest")
# install.packages("R6")
# 라이브러리 불러오기
library("rvest")
library("R6")
# 네이버 증권에서 삼성전자 확인. 삼성전자의 주식코드는 005930
# 일별시세를 나타내는 사이트 확인
# 테이블 주소 확인
# 주소를 복사하여 url_base에 저장
url_base <- 'http://finance.naver.com/item/sise_day.nhn?code=005930&page='
all.price <- c()
# 20쪽까지 자료 가져오기
for (page in 1:20){
price <- paste(url_base,page,sep='') %>%
read_html() %>%
html_nodes('table') %>%
.[1] %>%
html_table()
all.price <- c(all.price,price)
}
# 크롤링한 자료 확인
all.price[[1]]
# write.table 함수를 사용하여 크롤링한 자료를 txt파일로 저장
write.table(all.price, 'samsung_stock.txt')
반응형
'R 크롤링' 카테고리의 다른 글
[R크롤링] 6. 텍스트마이닝: 워드클라우드 (0) | 2017.12.19 |
---|---|
[R크롤링] 5. 데이터 분석(정제) (0) | 2017.12.18 |
[R크롤링] 3. R을 이용한 트위터 크롤링 (6) | 2017.12.11 |
[R크롤링] 2. R을 이용한 네이버(Naver) 영화 네티즌 리뷰 크롤링 (6) | 2017.12.09 |
[R크롤링] 1. R을 이용한 다음(Daum) 영화 네티즌 리뷰 크롤링 (0) | 2017.12.08 |