Luceneに頭文字のドット(例:英国、米国など)を保存したい場合は、どのアナライザを使用する必要がありますか? これを実行している間、Luceneに一連のストップワードを入力したいと思っています。Luceneのインデックス作成中に頭字語のドットを保存する
2
A
答えて
1
WhiteSpaceAnalyzerはドットを保存します。 StopFilterはストップワードのリストを削除します。必要な分析を正確に定義し、分析計とトークンフィルタを組み合わせて達成するか、write your own analyzerを設定する必要があります。
0
StandardTokenizerは、文字間に発生するドットを保存します。 StandardTokenizerを使用するStandardAnalyzerを使用できます。または、StandardTokenizerで独自のアナライザーを作成することもできます。
訂正:頭字語からドットを削除するStandardFilterを使用するため、StandardAnalyzerは役に立ちません。 StandardTokenizerと追加フィルタ(小文字フィルタなど)からStandardFilterを差し引いた独自のアナライザを構築できます。
関連する問題
- 1. LuceneインデックスをRDBMSに保存する
- 2. Luceneインデックスでアポストロフィを使用して単語を保存する
- 3. Lucene - インデックス作成の数値用語を破棄する方法
- 4. Pythonで頭字語を作成する
- 5. インデックスの単語を印刷する - Lucene
- 6. luceneでインデックスを作成するとき
- 7. MultiFieldQueryParserが頭字語からドットを削除しています
- 8. Luceneでのtxtファイルのインデックス作成
- 9. GDAL GDALRATSetValueAsString()中国語の文字を保存する方法(C#)?
- 10. luceneインデックスをディレクトリではなくストリームに保存
- 11. Luceneによるインデックス作成中に検索が応答しない
- 12. Luceneインデックスファイルをリモートロケーションに保存する
- 13. Lucene中国語アナライザ.NET
- 14. RDBMSまたはLuceneインデックスでのインデックス作成を有効にしています
- 15. カスタムカラーで中国語と日本語の文字を作成するには
- 16. Luceneインデックス特殊文字
- 17. Luceneインデックス作成と同時に検索する
- 18. Sitecore Lucene/Solrシステムフォルダのインデックス作成を避ける
- 19. Luceneの " - "文字でのインデックスの問題
- 20. 中国語を含むパンダのデータフレームをファイルに保存する
- 21. pandas to_csv()メソッド先頭のスペースで文字列を保存する
- 22. DLTKインデックス作成中
- 23. 特定のコード作成中のXcodeがインデックス作成中に終了する
- 24. Lucene.net - インデックス作成中にクラッシュする
- 25. Intellijがインデックス作成中にフリーズする
- 26. 私のIPとインデックスのインデックス作成を中止する
- 27. Pythonで文字列の単語をインデックスする関数を作成する
- 28. データベースにアラビア語の文字を保存する際の問題
- 29. 頭字語を作るためのPythonコーディングの欠陥
- 30. 単語を構成する配列の先頭に文字を追加する
urのコメントありがとうございました...参考、私は既に私のコードでStandardAnalyzerを使用しています: protected readonly StandardAnalyzer _analyzer = new StandardAnalyzer(stop_words); 頭字語からドットを削除しています... – Jimmy