です。私はウィキペディア(enwiki)の英語版を具体的に話しています。私はsqlダンプ(categorylinks、page、page_prop)をダウンロードすることによってWikipediaの他のより軽いバージョンにしようとしましたが、これは簡単にはできません。現時点では、SQLファイルからデータベースにデータを書き込んでいますが、これを行うには他にも簡単な方法が必要です。これには多くの時間がかかります。実際にデータの書き込みに成功した場合、クエリはおそらく永遠に続くでしょう。だから、どのように私は英国のWikipediaから記事とそのカテゴリのリストをコンパイルできますか?ウィキペディアからの記事カテゴリの関係のリストを取得する最も簡単な方法は
0
A
答えて
0
これは簡単な答えです。ダンプをダウンロードして使用することは、従来のコンピュータではあまり手近ではありません。ありがたいことに、私が使用したQuarryというサービスがあります.Wikipediaのデータベースに問い合わせてみましょう。しかし、制限があるので、上記のリストを取得するには、私はクエリをより細かく分割して、limit clause
を使用し、同じクエリに+50回を与えなければなりませんでした。このデータが必要な人は、私のquarry profileにアクセスし、Article - Categories
のクエリからデータを取得できます。
関連する問題
- 1. Python:dictから値のリストを取得する最も簡単な方法は?
- 2. ウィキペディアの記事を取得する
- 3. ウィキペディアの記事の最初の段落を取得する
- 4. ウィキペディアの最初の行を取得する記事
- 5. Java - リスト/配列内の各オブジェクトから単一のプロパティを取得する最も簡単な方法は?
- 6. ウェブサイトのルートドメインを取得する最も簡単な方法
- 7. ウィキペディアの記事の既定のイメージを取得するには?
- 8. Javaでデータベースメタデータを取得する最も簡単な方法は?
- 9. 複数のファイルから行を取得する最も簡単な方法
- 10. 異なるサイトからデータを取得する最も簡単な方法
- 11. 記事テーブルからカテゴリへの関係を持つMySQLクエリ
- 12. 双方向再帰関係を削除する最も簡単な方法は?
- 13. 最初のx文字を取得する最も簡単な方法は?
- 14. Scrapyでhttp.responseオブジェクトを取得する最も簡単な方法
- 15. オンライン通知を取得する最も簡単な方法
- 16. C#XMLデータを取得する最も簡単な方法
- 17. Android - 場所を取得する最も簡単な方法
- 18. UWP IoT - outlook.comカレンダーを取得する最も簡単な方法
- 19. 与えられた整数の全要素対のリストを取得する最も簡単な方法は?
- 20. ナビゲーションバー以外のビューの高さを取得する最も簡単で簡単な方法は何ですか?
- 21. コメントの関係で記事の翻訳を取得する方法は?
- 22. DirectShowからオーディオ/ビデオデータを取得する最も簡単な方法
- 23. 動的HTMLテーブルからデータを取得する最も簡単な方法
- 24. オブジェクトのリストをソートする最も簡単な方法
- 25. Javascriptで数字の記号を取得する最も簡単な方法は何ですか?
- 26. ページビューですべてのコンテンツ(URL)のリストを取得する最も簡単な方法は何ですか?
- 27. SharePoint 2010:Webアプリケーションのアイテム数を取得する最も簡単な方法は?
- 28. サブセットの合計数とカウントを取得する最も簡単な方法は?
- 29. サブデータフレームを取得する最も簡単な方法は何ですか?
- 30. 最も簡単な方法
正しく理解していれば、ウィキペディアからページを取得したいと思います。 'アルバート・アインシュタイン'、そしてページカテゴリーなども手に入れる? Wikipedia APIを使用したいと思うかもしれません:https://en.wikipedia.org/wiki/Special:ApiSandbox#action=query&prop=categories&titles=Albert%20Einstein – neoDev
ApiSandBoxを使ってみましたが、私が集めたものからApiには限界があります500レコードの、右か?記事の数は4〜5.000.000です。 – dmarkos