Programming/R
R 네이버 영화 웹 크롤링하기 #3 - [번외] 영화 리뷰 수집
R 네이버 영화 웹 크롤링하기 #3 - [번외] 영화 리뷰 수집
2017.10.23이번 내용은 1화, 2화와 관계없이 진행할 수 있습니다. (코드별 자세한 의미가 궁금하시면 1화, 2화를 참고해주세요) 네이버 영화 '쇼생크탈출'에 대해서 리뷰와 평점을 크롤링 해올게요. 네이버 영화 페이지 : http://movie.naver.com/movie/bi/mi/point.nhn?code=17421#tab [영화 리뷰의 일부] [결과값] 영화 쇼생크탈출에 대한 평점과 리뷰를 아래와 같은 형식으로 가져왔습니다 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 library(XML) library(stringr) all_reviews
R 네이버 영화 웹 크롤링하기 #2 - 영화 리뷰 키워드 수집
R 네이버 영화 웹 크롤링하기 #2 - 영화 리뷰 키워드 수집
2017.10.07전편 [R 네이버 영화 웹 크롤링하기 #1] 에 이어서 내용 계속하도록 하겠습니다. 너무 오랜만에 코드를 보니까 남이 짠 것 코드를 보는 것 마냥 새롭네요..ㅎ 전 내용에서는 '네이버 영화 랭킹 페이지'에서 1위부터 100위까지의 영화 목록을 수집했었습니다. 혹시 가공하지 않은 영화 리뷰에 대한 데이터가 필요하시다면 아래 게시글로 들어가주세요. [R 네이버 영화 웹 크롤링하기 #3 - [번외] 영화 리뷰 수집] 이번 게시글에서는 리뷰를 수집하여 가공하는 작업이 있습니다! 리뷰만 수집하시려는 분들에게는 불필요한 내용이 있어요! 이번 내용에서는 수집한 2000개의 영화에 등록된 리뷰과 평점, 특정 키워드 건수을 읽어들이겠습니다. 페이지 별로 URL의 형식이나, HTML이 구성되는 방식이 다르니까 변수 선언부..
R 네이버 영화 웹 크롤링하기 #1 - 영화 목록
R 네이버 영화 웹 크롤링하기 #1 - 영화 목록
2017.06.24R로 웹 크롤링을 할 수 있게 함수를 제공해주는 라이브러리를 이용하여 네이버를 웹 크롤링하겠습니다. 저는 네이버 영화 랭킹에 있는 영화를 대상으로 리뷰를 모두 긁어와 데이터 분석에 활용할 생각입니다. 그러기 위해서는 영화 목록을 먼저 가져와야겠죠! 이번 화에서는 네이버 영화 랭킹 페이지에 있는 영화의 목록 2000개를 가져오겠습니다. 다음 화는 [R 네이버 영화 웹 크롤링하기 #2 - 영화 리뷰 키워드 수집] 입니다^^ 가공되지 않은 영화에 대한 리뷰 정보만 필요하신 분들은 아래로 바로 넘어가주세요~ [R 네이버 영화 웹 크롤링하기 #3 - [번외] 영화 리뷰 수집] 대상이 되는 웹사이트(네이버 영화)를 선택한 후, 크롬-개발자도구를 이용하여 소스를 봅시다. http://movie.naver.com/mo..
Mac에서 R 그래프 한글 인코딩 깨짐 현상(+해결) in R
Mac에서 R 그래프 한글 인코딩 깨짐 현상(+해결) in R
2017.06.03Windows에서는 한글 깨짐 현상이 덜 하다던데 Mac에서는 한글 깨짐현상에 대한 글이 자주 보인다.Mac에서 발견된 한글 인코딩 문제로는 크게 세가지가 있다. 1. R edit 내 한글 인코딩==> Mac 터미널 기본 어플에서 아래와 같은 명령어를 수행하면 한글 인코딩 설정이 되어 한글이 깨지지 않는다.defaults write org.R-project.R force.LANG ko_KR.UTF-8 2. R에서 사용하는 그래프 라이브러리 사용 시 한글 깨짐R 인코딩도 utf-8로 맞추어놨는데 뭐가 문제인지 아래와 같이 Quartz의 한글이 'ㅁ'로 깨져서 보이는 현상이 있다. ## 1. 터미널에 접속해서 .Rprofile 파일을 찾는다.12$touch ~/.Rprofile$ open ~/.Rprofil..
[스크랩] KoNLP 만든 이의 R 시각화 논문
[스크랩] KoNLP 만든 이의 R 시각화 논문
2017.06.03R 기반의 데이터 시각화 전희원 http://freesearch.pe.kr
R에서 한글 형태소 분석을 위한 KoNLP 라이브러리 설치 in R
R에서 한글 형태소 분석을 위한 KoNLP 라이브러리 설치 in R
2017.06.03R에서 텍스트마이닝을 하기 위해서는 한글 형태소 분석 라이브러리인 KoNLP를 설치해야한다. ## 1. R에서 KoNLP 라이브러리 설치하기 (최초 1회)1> install.packages("KoNLP")cs ## 2. KoNLP 라이브러리를 사용할 때 마다 include 해준다.1> library(KoNLP)cs ## 만약 라이브러리 호출 시 아래와 같은 에러가 생긴다면 rJava를 설치해준다.1234567891011에러: package or namespace load failed for ‘KoNLP’: .onLoad가 loadNamespace()에서 'rJava'때문에 실패했습니다: 호출: dyn.load(file, DLLpath = DLLpath, ...) 에러: 공유된 객체 '/Library/Fr..
Mac에서 R 설치 & 인코딩 변환하기 in R
Mac에서 R 설치 & 인코딩 변환하기 in R
2017.06.03아래 사이트에 접속 후 R 다운로드하기http://cran.nexr.com/ OS에 맞게 다운로드할 R 버전을 선택한다.Mac OS 의 경우 'Download R for (Mac) OS X' 을 선택 후, 최종 R 패키지를 다운로드한다. 다운로드 후 한글 인코딩 설정을 위해Mac 기본 어플인 터미널에 접속하여 아래와 같이 명령어를 실행한다.defaults write org.R-project.R force.LANG ko_KR.UTF-8 끝!