2017-04-24 10 views
0

これはRでWebスクラップするコードです。うまくいきます。webscraping後に空白のない.txtファイルを保存します。

require(httr) 
require(rvest) 
library(KoNLP) 
useSejongDic() 


total = c() 
site = "http://movie.daum.net/moviedb/grade? 
movieId=92107&type=netizen&page=" 

for(i in 1:10){ 
    url = paste0(site, i); 
    mention = GET(url) %>% read_html() %>% 
    html_nodes("p.desc_review") %>% 
    html_text() %>% 
    repair_encoding(); 
    total = rbind(total, mention); 
} 


total = gsub("\t","",total) 
total = gsub("\n","",total) 

text1=extractNoun(total) 
noun= sapply(total,extractNoun,USE.NAMES = FALSE) 
undata= unlist(noun) 
write(undata,"C:\\Users\\dlgof\\DATA.txt") 

ただし、txtファイルに空白が多すぎます。どうすれば削除できますか?

enter image description here

答えて

0

あなたundataは "" をたくさん持っているように見えます。あなたが書く前に、

undata = undata[undata != " "] 

を追加してください。

+0

ありがとうございます!!!!!私はこの2日間苦労して、ついにそれは働く – LEE

関連する問題