2016-12-19 16 views
2

に表示されない私は(ちょうど研究の目的のために、私は彼らの許可を持っている)、このWebページの基本的なWebクローラーの仕事をしています:Webクローラー:Webコンテンツは、htmlコード

http://www.seattle.gov/council/calendar#/?i=0

私がしたいのは、すべてのイベントの「時間」、「説明」、「場所」をその形式で取得することです。私はpythonの正規表現を試してみましたが、これらの情報がこのページのHTMLコードに表示されないようです。代わりに、私はセレンを使用していますが、私はまだこの情報を見つける場所を知らない。

+0

これらは** RSSフィード**を提供します。参照してください:http://www.trumba.com/calendars/seattle-city-council.rss –

答えて

1

時々、物事はあなたの前にありますが、あなたはそれらを見ません。

RSSフィードからデータを取得/抽出できます。それはここにあります:http://www.trumba.com/calendars/seattle-city-council.rss

これは役に立ちます。

+0

私はこのオプションについて考えたことはありません!どうもありがとうございます!それは私に全体の午後を要した... – Emile

+0

私の喜び@Emile –

関連する問題