2017-05-30 12 views
0

私はローカルメディアウィキインスタンスを設定しました。それはうまく動作しています。今私はウィキペディア全体をローカルにしたい。ローカルメディアウィキにウィキペディアのデータを統合するにはどうすればよいですか?

私は、このダンプを見つけました:https://dumps.wikimedia.org/enwiki/latest/

私はファイルをダウンロードしますか?

ダウンロードしたら、データをmediawikiにプッシュアップするように設定するにはどうすればよいですか?

私は:https://github.com/rlewkowicz/docker-mediawiki-stackを使用して、AWSインスタンスにMediaWikiを設定しました。

私の最終目標は、公開されているエンドポイントではなく、AWSインスタンスからWikipedia Search APIを使用することです。

答えて

0

Wikipediaのダンプが大きく、インストールがクラッシュする可能性があります。とにかく試してみたいのであれば、おそらくmwdumperがxmlファイルの最善の策でしょう。それはあまりよく管理されていません。私は自動的にアップデートをプッシュするためのすぐれたソリューションはないと思います。

+0

こんにちは、そのダンプにはたくさんのxmlファイルがあります。どちらをダウンロードしますか? –

+0

あなたが望むものによって異なります。タイムスタンプベースのURL(https://dumps.wikimedia.org/enwiki/20170520/など)を使用している場合は、何が何かに関する情報が得られます。 – Tgr

関連する問題