-1
私は、Wikipediaダンプの単語のペアを含む特定の文章を検索することに興味があります。 1つのアプローチは、ダンプXMLを抽出した後にすべての文書をトラバースすることです。もっと良い解決策はありますか?javaのWikipediaダンプからテキストを検索する最善の方法は何ですか?
私は、Wikipediaダンプの単語のペアを含む特定の文章を検索することに興味があります。 1つのアプローチは、ダンプXMLを抽出した後にすべての文書をトラバースすることです。もっと良い解決策はありますか?javaのWikipediaダンプからテキストを検索する最善の方法は何ですか?
逆インデックスをおすすめします。あなたはここでのLucene、弾性検索、Solrの、など
を使用することができLuceneインデックスを使用した例である:Wikipedia index using lucene
たぶん、あなたはluceneのようないくつかの検索エンジンを試みることができます。 – zhh