2017-11-17 4 views
0

ファイルの部分(urllib2)にテキストを保存しますが、要素の抽出はできません(votestitle、...)。 ページはhttps://stackoverflow.com/?tab=monthhttps://stackoverflow.com/?tab=monthから要素(タイトル名、票、ビュー、各タイトルの回答)を抽出する方法は?

どのように私はウェブページを取得し、すべてのタイトルを抽出するために、Pythonスクリプトを書くかいいえ。それぞれの質問で受け取った意見、票、回答はどれですか?

+0

何か試しましたか? –

+0

はい、私はurllib2を使ってコンテンツを抽出することができましたが、要素の抽出は私が望むものではありませんでした。 –

+0

あなたが持っているコードを投稿し、動作しないものを記述してください。 –

答えて

1

ページをクロールする場合は、あなたがscrapyのようなライブラリを使用することができますが、ここにアクセスし、約読むことができますソート機能、で、RESTのAPIを使用することは非常に良いと簡単にStackOverflowがあります https://api.stackexchange.com/docs/ 取得します質問などは、このページをご覧ください: https://api.stackexchange.com/docs/questions

関連する問題