2012-02-01 1 views
0

私は、XMLを使用してデータベースに挿入できるJavaプログラムを作成する可能性を考えました。私は圧縮されたWikipediaのページファイルを抽出したので、今はxml.bz2だけでなくxmlにもあります。私はWikipediaのウェブサイトを見てきましたが、成功しませんでした。何かを見つけることができませんでした。私はこれが非常に難しいプロセスではないと思っています。それは簡単なものでなければならないと私はあなたに尋ねています:Wikipediaのxml.bz2オプションをインポート

答えて

1

接尾辞はbzip2です。あなたがLinuxや他のUnixish OSを使用しているなら、すでにbzip2デコンパプターがインストールされているはずです。 Windowsの場合はhereをダウンロードできます。

外部デコンプレッサーを使わずにbzip2圧縮ストリームを直接読み込めるJavaライブラリがあります。そのうちの1つはhereです。

編集:お待ちください、私はあなたの質問を誤解したと思います。既にXMLダンプを解凍してしまったようですが、今ではそれをどうするのか知りたいと思っています。その場合は、mwdumperをご覧ください。

+0

いや、私はmwdumperを見つけました。 – Andrew