2012-04-10 5 views
0

私はsolrによって設立されたエンジンを使ってPMIに関する研究をしています。私はコーパス内のキーワードの数を取得したい(numofDocsではなく)。これを得る直接的な方法はありますか? 別の質問: solrシステムでロジックオペレータ(NEARなど)を含む検索を実行できますか?またはこれを行うにはsimilaryメソッド?solr:コーパス全体でキーワードの数を取得するにはどうすればよいですか?

+0

「コーパス内のキーワードの数」とはどういう意味ですか?明確にしていただけますか?特定の文書に一致するキーワードの数を意味しますか?または返されたすべてのドキュメントの一致するキーワードの数?または一致するドキュメントのキーワードの総数? –

+0

すべての文書で一致するキーワードの数を意味します。 – wensir

+0

ああ、ドキュメントがマッチした場合、ドキュメント内のいくつの単語が検索にマッチしたかを知りたいですか?一致する各文書に対して同じ処理を行いますか?私はそれを行う直接的な方法は知らない。しようとしているのは、 '&hl.fragsize = 0'で強調表示を使用して(文書全体を返します!)、返されたデータを解析することです(ハイライトタグ内の単語境界の数が1になります)。 –

答えて

2

NEARは "近接検索"です。

field:"phrase of words"~10 

10フレーズ内の単語でなければなりませんどのように近いです:Solrには次の形式を持っている「sloppy phrase queries」の形で同様のものを提供しています。

+0

ありがとうございました! – wensir