2017-12-26 9 views
-1

私は、Wikipediaダンプの単語のペアを含む特定の文章を検索することに興味があります。 1つのアプローチは、ダンプXMLを抽出した後にすべての文書をトラバースすることです。もっと良い解決策はありますか?javaのWikipediaダンプからテキストを検索する最善の方法は何ですか?

+0

たぶん、あなたはluceneのようないくつかの検索エンジンを試みることができます。 – zhh

答えて

0

逆インデックスをおすすめします。あなたはここでのLucene、弾性検索、Solrの、など

を使用することができLuceneインデックスを使用した例である:Wikipedia index using lucene

関連する問題