Luceneで索引付けされた100の文書があるとします。 "アメリカン航空"という言葉を検索したい。 Luceneは検索を実行し、「アメリカン航空」という言葉を含む10の文書を返します。私は今、これらの10個のドキュメントをそれぞれのUIで見ることができ、それぞれのマッチに自動的にハイライト/スクロールすることができます。これらは、id-ed段落タグが一意になっているすべてのhtml文書です。http://docurl#p_120
などを使ってスクロールして<p id="p_120">American Airlines is a big company.</p>
にスクロールすることができます。しかしLuceneにどのような段落があるのか教えてもらうにはどうしたらいいですか?Luceneは文書内の一致箇所を見つけることができますか?
0
A
答えて
0
あなたの質問はハイライトについてです。サブ文書のテキストのインデックスを作成して、強調表示するサブ文書のIDを知る方法を尋ねます。
あなたには3つの可能性があります。しかし最初に、luceneは強調表示のためにオフセット(=原文の位置)を使うことができます。 https://lucene.apache.org/core/6_4_0/highlighter/org/apache/lucene/search/highlight/package-summary.html そして、luceneはサブ文書の概念を「ブロックされた子文書」または「入れ子文書」または「埋め込み文書」ドキュメント "。
ツリーの可能性:
- 用語の各出現についての対応するサブ文書のIDを格納するために使用ペイロード。
- は、用語の各オカレンスのオフセットを格納し、新しいサブ文書がどのオフセットで開始されるかを認識します。追加のフィールドに対応するオフセットとともにidsを格納し、これを使用して各ヒットのIDをルックアップします。
- ブロック内の追加の子ドキュメントとして、すべてのサブ文書と共に文書を索引付けします。 http://lucene.apache.org/core/6_4_0/join/index.html?org/apache/lucene/search/join/ToParentBlockJoinCollector.html
関連する問題
- 1. Lucene:シンボルを見つけることができません
- 2. pythonのインデックス作成、書き込みvalsの一致箇所
- 3. がHTTPまで一致する文字列を見つけること
- 4. URIパターンの一致する文書を見つける
- 5. (Phoenix.ActionClauseError)が一致を見つけることができませんでした
- 6. Selenium '一致するセットを見つけることができません。エラー'
- 7. 一致する機能を見つけることができません
- 8. 一致するコントローラMVCを見つけることができません
- 9. 文字列が一致するとExcelシート内の列名を見つける
- 10. VBA(MSWord):特定のrgb色で箇条書き点を見つけることはできません
- 11. 見つける一致が
- 12. Luceneを使用して単一の用語内で一致するものを見つける方法
- 13. MongoDBは既存の文書を見つけることができません
- 14. 文字列内の文字のn番目の出現箇所を見つけて置換する方法は?
- 15. は、私は別の場所でのSpring Beanを使用することはできますか一箇所に
- 16. luceneのテキストの冒頭に一致が見つかった場合に文書を拡大する方法
- 17. Firefoxは場所を見つけることができますがSafariは見つかりません
- 18. 文書IDを指定すると、Elasticsearchで一致する文書が見つかります。
- 19. MarkLogicが私のXML文書を見つけることができません
- 20. TextMateは、一致する開始タグと終了タグを見つけることができますか?
- 21. 列Dの一致箇所がある場合は、文字列Aと文字列Bを比較します
- 22. BeautifulSoupは値が一致する要素を見つけることができますか?
- 23. ARMデプロイメントエラー文書Dbがインスタンスを見つけることができません
- 24. 文字列内の特定の文字の出現箇所を見つけて表示する(シェル/ AIX)
- 25. Androidのソフトボタンバーの場所を見つけることはできますか?
- 26. SQLの曜日の次の出現箇所を見つける
- 27. MongoDB文書で一致する配列項目を見つける
- 28. なぜgrepはGroovyの依存関係で一致を見つけることができませんか?
- 29. 文字列内の文字の最初の出現箇所を見つける(java)
- 30. どのようにしてagにnode_modulesでの一致を見つけることができますか?
参照Luceneの[蛍光ペンAPI](http://lucene.apache.org/core/6_4_0/highlighter/org/apache/lucene/search/highlight/Highlighter.html)で検索します。 – femtoRgon