WikipediaのXMLダンプをダウンロードした場合、XMLファイル内からすべての内部リンクを削除する方法はありますか?それらの使用に関するWikipediaのXMLファイルから内部リンクを削除するには?
おかげ
WikipediaのXMLダンプをダウンロードした場合、XMLファイル内からすべての内部リンクを削除する方法はありますか?それらの使用に関するWikipediaのXMLファイルから内部リンクを削除するには?
おかげ
ローカルWikiにインポートする場合は、必要なファイルをすべてインポートしてから、ロボット(例:pywikipediabot)を使用してすべての内部リンクを削除します。
さらに、あなたのインターネットアクセスがあるどこかであなたのwikiが使用されるならば、あなたは[[wikipedia:PageName | PageName]]への内部リンクをすべて変更して元の記事を参照することができます。 –
ウィキペディアデータベースダンプと情報はここにあります:Wikipedia:Database download。 Wikipediaを掻き取るためのスクリプトを書くのではなく、これを行うべきです。
ええ、本当に間違って私の質問を得たことがわかった! xmlファイルから内部リンクを削除するにはどうすればよいですか? –
好きなテキストエディタで[[と]]を何も置き換えずに検索して置き換えることができます。
XMLファイルを別のXMLファイルに変換するためにXSLTを使用しようとします。
ありがとうございました。 –
好奇心の中でどの方法を解決しましたか? –
残念ながら、[[Wikipediaの特別なフォーマットのためには機能しません。私はまだボットに自信がないので、私はそれをするために誰かに払うことができるまで、それは現時点では保留です!だから、方法はありません!みんな助けてくれてありがとう、とても便利。 –