特定のエンティティに弾性のタグを付けることができます。これはサポートされていますか?例: ElasticSearchのエンティティタグ
Hello my name is Johnny
トークン Hello my name is johnny < person
にそれをタグ付けし、後でそれらのエンティティをハイライト表示するには:テキストの? 誰かがこのようなことやプラグインを知っているのか、あるいは何らかの方向性が役立つでしょうか。
特定のエンティティに弾性のタグを付けることができます。これはサポートされていますか?例: ElasticSearchのエンティティタグ
Hello my name is Johnny
トークン Hello my name is johnny < person
にそれをタグ付けし、後でそれらのエンティティをハイライト表示するには:テキストの? 誰かがこのようなことやプラグインを知っているのか、あるいは何らかの方向性が役立つでしょうか。
Elasticsearchは、固有表現認識を行いません。ただし、この1つのプロセッサーと同じように、インテント・プロセッサーを使用することもできます(正確なユースケースのために変更する必要があります)。https://github.com/spinscale/elasticsearch-ingest-opennlp
ただし、ドキュメントのインデックスを作成する前に、名前付きエンティティの認識を行う方がよいでしょう。 openNLPやNLTKを試してみることもできますし、非営利プロジェクトの場合はスタンフォードNERを試すこともできます。インデックス作成の前に、自分自身で「ハイライト」タグを追加したいと思います。私はこのような何かを考えています:
<ne type="person">Johnny</ne> is from <ne type="place">New York</ne>
次の2つのフィールドを、タグなしのいずれかを分析するためのタグを破棄、または単にインデックスするためのカスタム・アナライザを使用することができます。
はい、私はこれを考えました。タグを破棄するアナライザの提案に感謝します。私の選択肢は、検索される可能性の低いタグを作ることでした。 – aclokay