2016-10-03 5 views
-1

私はpageIdsとタイトルを含むwikipediaダンプを探しています。私は実行時にそれを要求したい、または要求ごとに2000を要求したくない、私はそれをすべて望む、私はすべてのpageIdsとそれらに属するタイトルの長いリストを作成し、自分のデータベースに入れて、それは自分のデータベースからデータを要求するアプリケーションの中にあります。wikipediaすべてのページタイトルとページIDをダンプします

ダンプにはこれらの情報が含まれていますか?彼らが私が必要とするより多くの情報を含んでいるかどうかは関係ありません - 私は必要な情報を選ぶアプリを書くことができます。

私はそれを要求しようとしました...それは140日かかるでしょう、彼らは2700要求のいくつかの限界を置く...それは永遠にすべてを得るために代わりに、私はファイルダムをダウンロードしたいそして、データをきれいにし、私は

答えて

-1

[OK]をが短い中で答えは、複数のダンプを取得した後、それを自分自身を発見した必要がある唯一の情報含む自分のデータベースにファイルをアップロード: enwiki-最新-page.sql.gz

ページIDとタイトルが含まれています。

エントリは次のようになります。 (1217768,0、 'Black_River_(South_Carolina)'、 ''、0,0,0,0.6285160577990001、 '20161001141146'、 '20161001142916'、738899573,1654、 'ウィキテキスト')

最初の番号はpageIdです。 3番目の項目はタイトルです。

休憩私はこの問題を解決し、それを閉じます:D袋に大きなパット

関連する問題