私はspeeches-usa.comのタイトルリンクを掻き取ろうとしています。され、次の私のPythonコード:Scraping SpeechesUSA.com
SPEECH_SOURCE = 'http://www.speeches-usa.com/'
def get_speeches():
cj = CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
p = opener.open(SPEECH_SOURCE)
soup = BeautifulSoup(p.read(), PARSER_TYPE)
info = soup.find_all('a', class_='ListText')
elements = []
for element in info:
elements.append(element)
for i in x range(0, min(len(elements), 5)):
print elements[i]
(1)私はリンクを取得するためにsoup.find_all()の引数に入れてよく分からない - 私はelements.appendを入れてみましたが(element.get_text())しかし、それは(2)の結果が不完全に見えるリンク
John Adams - Inaugural
Address
Samuel Adams - American
Independence
Spiro Agnew - Television
News Coverage
Susan B. Anthony - Women's
Right to Vote
を奪うれ、代わりに次を与え、例えば、我々は以下のコードでジェーン・アダムスが欠落しています。
<a class="ListText" href="Transcripts/john_adams-inaugural.html">John Adams - Inaugural
Address<br/>
</a>
0
<a class="ListText" href="Transcripts/samuel_adams-independence.html">Samuel Adams - American
Independence<br/>
</a>
1
<a class="ListText" href="Transcripts/spiro_agnew-networknews.html">Spiro Agnew - Television
News Coverage<br/>
</a>
2
<a class="ListText" href="Transcripts/susan_b_anthony-vote.html">Susan B. Anthony - Women's
Right to Vote</a>
3
<a class="ListText" href="Transcripts/spiro_agnew-networknews.html"></a>
4
お手数をおかけしますようお願い申し上げます。
このコードは実行可能ではありません - 関連の輸入および変数(例えば 'SPEECH_SOURCE') – asongtoruin
編集などの使用可能な例を、投稿してください!キャッチするためにありがとう。 –