webscraping後に空白のない.txtファイルを保存します。

これはRでWebスクラップするコードです。うまくいきます。webscraping後に空白のない.txtファイルを保存します。

require(httr) 
require(rvest) 
library(KoNLP) 
useSejongDic() 


total = c() 
site = "http://movie.daum.net/moviedb/grade? 
movieId=92107&type=netizen&page=" 

for(i in 1:10){ 
    url = paste0(site, i); 
    mention = GET(url) %>% read_html() %>% 
    html_nodes("p.desc_review") %>% 
    html_text() %>% 
    repair_encoding(); 
    total = rbind(total, mention); 
} 


total = gsub("\t","",total) 
total = gsub("\n","",total) 

text1=extractNoun(total) 
noun= sapply(total,extractNoun,USE.NAMES = FALSE) 
undata= unlist(noun) 
write(undata,"C:\\Users\\dlgof\\DATA.txt")

ただし、txtファイルに空白が多すぎます。どうすれば削除できますか？

出典

2017-04-24 LEE

あなたundataは "" をたくさん持っているように見えます。あなたが書く前に、

undata = undata[undata != " "]

を追加してください。

出典

2017-04-24 08:04:05 shians

ありがとうございます!!!!!私はこの2日間苦労して、ついにそれは働く – LEE

webscraping後に空白のない.txtファイルを保存します。

答えて

関連する問題