카테고리 없음

R언어 웹툰 평점 웹크롤링 및 오름차순(2학년 1학기 기말고사 발표자료)

수닝이 2023. 10. 21. 13:06

발표에 사용되었던 코드

install.packages('httr')
install.packages('rvest')
library(rvest)
library(httr)

fin_test=data.frame()

#웹툰에서 필요한 정보 가져오기
for (i in 1:41){ #총 41페이지이므로 for문을 통해 페이지 전부 가져오기
  
  # 웹툰 링크 가져오기
  url = paste0('https://comic.naver.com/webtoon/list?titleId=570503&weekday=thu&page=',i)
  
  #get함수를 이용하여 url에 데이터 요청하기
  get_url = GET(url)
  
  #가져온 데이터 html로 읽어오기
  content = read_html(get_url)
  
  #웹툰에서 가져온 평점정보를 가지고 추출하기
  평점= html_nodes(content,'.rating_type')
  평점
  
  #text불러오기
  평점 = html_text(평점,trim = TRUE)
  평점
  
  #사이트에서 제목정보 가져오기
  제목 = html_nodes(content,'td.title')
  제목
  
  #text불러오기
  제목 = html_text(제목,trim = TRUE)
  제목
  
  #제목과 평점을 하나의 데이터 프레임으로 엮기
  fin_test = rbind(fin_test,data.frame(제목,평점))
}

#엑셀에 데이터 프레임 저장하기
install.packages('writexl')
library(writexl)
write_xlsx(fin_test,path = 'C:/Users/sou54/Desktop/Rlang/평점_회차정보.xlsx')

 

평점을  액셀기능을 이용해 오름차순해준다.

평점_회차정보(평점_오름차순_작업한 것).xlsx
0.02MB

당시 진행했던 발표자료

R언어 기말고사 발표자료.pptx
1.06MB