2016-09-01 22 views
1

私は弾性のある検索エンジンに大きなpdfファイルを索引付けしました。私はこの非構造化データを雪崩解析装置で分析しました。これは、スノーボールフィルターを使用して「実行中」のような単語を「実行中」に変換します。しかし、「走っている」という言葉を正確に検索したいのですが?これは私を助けない。弾性検索の正確な一致

これらは大きなファイルであり、インデックスサイズを大きくすることができるため、別のフィールドを使用することはできません。

私はどのように "preserver_original"のようなものを使用するためにスノーボールフィルターを使用することができますか?私は元の言葉をそのまま残しておくことができます。

私の要件に応じてフィールドを分析する方法や代替方法はありますか?

答えて

関連する問題