2017-07-03 18 views
0

次のコードを使用してpythonを使用してURLからレビューを抽出していますが、エクスポートされたcsvは列内のすべてのレビューを持っていません。代わりに、別の列にデータをエクスポートします。 既存のコードにコードを追加する必要がありますか?TripadvisorのWebをPythonを使用して掻き集める

import requests 
from unidecode import unidecode 
from bs4 import BeautifulSoup 
URL = "https://www.tripadvisor.in/Hotel_Review-g295424-d1735662-Reviews- 
Winchester_Grand_Hotel_Apartments-Dubai_Emirate_of_Dubai/" 
r = requests.get(URL) 
soup = BeautifulSoup(r.content, 'html5lib') 

resultsoup = soup.find_all("p", {"class" : "partial_entry"}) 

with open('testreview.csv', 'w') as fid: 
    for review in resultsoup: 
     review_list = review.get_text() 
     fid.write(unidecode(review_list)) 
+0

csvファイル(https://docs.python.org/2/library/csv.html)には 'csv.writer'を使用することをおすすめします。 – Peri461

答えて

-1

ファイルに書き込む行に改行文字( '\ n')を追加するだけで済みます。

ファイルに書き込む行に改行文字( '\ n')を追加するだけで済みます。

with open('testreview.csv', 'w') as fid: 
    for review in resultsoup: 
     review_list = review.get_text() 
     fid.write(unidecode(review_list+'\n')) 
関連する問題