私はウィキペディアの最新のダンプをダウンロードし、それをMySQLデータベースとして解析しました。今私はタイトルとcontent.Myのみを含むデータベーステーブルがあります。私の要件は、このテーブルからすべての伝記の内容を抽出することです。私はすべての伝記のタイトルを持つダンプファイルが欲しい。 ありがとうございますWikipediaで伝記のタイトルにアクセスする
0
A
答えて
0
すべての記事を一部のカテゴリとそのすべてのサブカテゴリで取得したい場合は、the categorylinks
tableを使用し、それを再帰的に歩いてサブカテゴリを取得する必要があります。
あなたの質問から、正確に何が欲しいのかは明らかではありません。記事についての略歴をご希望の場合は、Category:Biographyをご覧ください。 の記事がの場合は、Category:Peopleのサブカテゴリを見てください。
+0
私は人に関する記事が必要です.Wikipediaのすべての記事トピックをpeople.Like mysqlダンプのように入手できますか? –
+0
いいえ、あなたはカテゴリツリーを自分で歩く必要があります。 – svick
関連する問題
- 1. すべてのWikipedia記事のタイトルを取得するには?
- 2. wikipedia webservicesにアクセスする
- 3. GeoNames Java APIを使用して座標を取得するWikipedia記事タイトル
- 4. JSONPでWikipedia APIにアクセス
- 5. RからWikipediaにアクセスするには?
- 6. Wikipedia API - JSONオブジェクトへのアクセス
- 7. WikiPediaの単語頻度記事
- 8. Wikipedia記事の紹介部分をPythonで抽出する
- 9. 円グラフの伝記matplotlib
- 10. タイトルなしタイトな伝説の国境
- 11. matplotlibの - グローバルな伝説とタイトル脇サブプロット
- 12. APIによるWikipedia記事のWikidata IDの取得方法は?
- 13. アクセスmissleadingのタイトル
- 14. wikipediaのランダムな記事を取得する
- 15. データにアクセスするタイトルの剣道グリッド
- 16. 左に伝説のタイトルを付ける方法は?
- 17. 平均時間/(a-1)ダイナミックアレイ上のWikipediaの記事に
- 18. Wikipedia API:場所/市街地を取得する方法/記事
- 19. Googleのチャート - 伝説のタイトルがここに
- 20. erlangを使ってwikipediaページのコンテンツやタイトルを取得する方法は?
- 21. 記事からwikipediaの説明を取得します
- 22. bashの伝統分割記号
- 23. Wikipedia APIを使用して記事のメインカテゴリを取得するには
- 24. XMLで記事を投稿できるwikipedia apiを探しています
- 25. Wikipedia APIからタイトルと要約のリストを取得するにはどうすればよいですか?
- 26. wikipedia wikipediaでスクラップする1.4.0:悪い結果をスキップするには?
- 27. Wikipedia list = search REST API:一致する記事のURLも取得する方法
- 28. 理解行動BDD上のWikipediaの記事
- 29. 選択したWikipediaの記事を自分のwikiにコピーしますか?
- 30. Wingdingsの記号にアクセスするフォント
データベーステーブルには、そのタイトルに関連するタイトルとコンテンツのみが含まれています。これはenwiki-articles-latest.xmlを解析して得ました。しかし、私の要件は、カテゴリーバイオグラフィーのタイトルに関連するコンテンツのみを取得することです。私がウィキペディアですべての伝記のリストを入手したら、私は自分のデータベーステーブルからコンテンツを取り出すことができます。 –