R언어 웹툰 평점 웹크롤링 및 오름차순(2학년 1학기 기말고사 발표자료)
발표에 사용되었던 코드
install.packages('httr')
install.packages('rvest')
library(rvest)
library(httr)
fin_test=data.frame()
#웹툰에서 필요한 정보 가져오기
for (i in 1:41){ #총 41페이지이므로 for문을 통해 페이지 전부 가져오기
# 웹툰 링크 가져오기
url = paste0('https://comic.naver.com/webtoon/list?titleId=570503&weekday=thu&page=',i)
#get함수를 이용하여 url에 데이터 요청하기
get_url = GET(url)
#가져온 데이터 html로 읽어오기
content = read_html(get_url)
#웹툰에서 가져온 평점정보를 가지고 추출하기
평점= html_nodes(content,'.rating_type')
평점
#text불러오기
평점 = html_text(평점,trim = TRUE)
평점
#사이트에서 제목정보 가져오기
제목 = html_nodes(content,'td.title')
제목
#text불러오기
제목 = html_text(제목,trim = TRUE)
제목
#제목과 평점을 하나의 데이터 프레임으로 엮기
fin_test = rbind(fin_test,data.frame(제목,평점))
}
#엑셀에 데이터 프레임 저장하기
install.packages('writexl')
library(writexl)
write_xlsx(fin_test,path = 'C:/Users/sou54/Desktop/Rlang/평점_회차정보.xlsx')
평점을 액셀기능을 이용해 오름차순해준다.
당시 진행했던 발표자료