0
私はPythonとデータマイニングにはまったく新しいので、出力から部品を抽出する質問があります。私は3.6でPythonを使用しており、今日は朝にすべてのものを更新しました。私は出力を匿名化し、パスワード、トークンなどを含むすべての行を削除しました。beautifulsoupでコメントを抽出するには?
from bs4 import BeautifulSoup
soup = BeautifulSoup(open("facebookoutput.html"), "html.parser")
comments = soup.findAll('div', class_="_2b06")
print(comments[0]) # show print of first entry:
<div class="_2b06"><div class="_2b05"><a href="/stuartd?fref=nf&rc=p& amp;__tn__=R-R">some Name </a></div><div data-commentid="100000000000000000222222000000000000000" data-sigil="comment-body">There is nice comment. I like stackoverflow. </div></div>
「いいコメントがあります。私はスタックオーバーフローが好きです。
ありがとうございます。
'コメント[0] .div.find_all( 'DIV')[ - 1] .text' ...多分? –
私はこれを試しましたが、 'IndexError:list index of range'を返しました。 – smurfit89