R 네이버 영화
R 네이버 영화 웹 크롤링하기 #3 - [번외] 영화 리뷰 수집
R 네이버 영화 웹 크롤링하기 #3 - [번외] 영화 리뷰 수집
2017.10.23이번 내용은 1화, 2화와 관계없이 진행할 수 있습니다. (코드별 자세한 의미가 궁금하시면 1화, 2화를 참고해주세요) 네이버 영화 '쇼생크탈출'에 대해서 리뷰와 평점을 크롤링 해올게요. 네이버 영화 페이지 : http://movie.naver.com/movie/bi/mi/point.nhn?code=17421#tab [영화 리뷰의 일부] [결과값] 영화 쇼생크탈출에 대한 평점과 리뷰를 아래와 같은 형식으로 가져왔습니다 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 library(XML) library(stringr) all_reviews
R 네이버 영화 웹 크롤링하기 #2 - 영화 리뷰 키워드 수집
R 네이버 영화 웹 크롤링하기 #2 - 영화 리뷰 키워드 수집
2017.10.07전편 [R 네이버 영화 웹 크롤링하기 #1] 에 이어서 내용 계속하도록 하겠습니다. 너무 오랜만에 코드를 보니까 남이 짠 것 코드를 보는 것 마냥 새롭네요..ㅎ 전 내용에서는 '네이버 영화 랭킹 페이지'에서 1위부터 100위까지의 영화 목록을 수집했었습니다. 혹시 가공하지 않은 영화 리뷰에 대한 데이터가 필요하시다면 아래 게시글로 들어가주세요. [R 네이버 영화 웹 크롤링하기 #3 - [번외] 영화 리뷰 수집] 이번 게시글에서는 리뷰를 수집하여 가공하는 작업이 있습니다! 리뷰만 수집하시려는 분들에게는 불필요한 내용이 있어요! 이번 내용에서는 수집한 2000개의 영화에 등록된 리뷰과 평점, 특정 키워드 건수을 읽어들이겠습니다. 페이지 별로 URL의 형식이나, HTML이 구성되는 방식이 다르니까 변수 선언부..