ここでは一般的なガイダンスを探しています。NLP - 2つのテキストが類似のオブジェクトを参照しているかどうかを確認する方法
高レベルの使用例では、いくつかの情報を抽出して処理する必要がある製品ドキュメント が届きました。 を実行する前に、ドキュメントが実際に を正しい製品に参照していることを確認する必要があります。そのためには、製品の 見出し/説明を正しいものとして検証する必要があります。
だから私は2つのテキスト
- テキスト1持っている - これは私と一緒に利用できる実際の製品見出し/記述である、ことができます - これは、いくつかの文書
- テキスト2から抽出された製品情報を参照し正しいとみなされる。
両方のテキストが同じ製品またはオブジェクトを参照することを検証する必要があります。
例:あなたが見
Text 1 (to be validated) - Optimus Prime Costume, Blue, with good packaging and warranty
Text 2 (correct info) - Optimus Prime Blue Costume, Medium Size`
、私は両方のテキストがOptimus Prime Costume
を参照することを確認する必要があります。
- コサインを文字列
しかし、彼らとの問題は、彼らがテキスト全体に依存していることであるとの
次のように私は処理を考えていた: -
- テキスト2.テキスト2から色、サイズ情報などを削除するには、非常に簡潔で、ランダムなデータが含まれていません。製品名とサイズ、カラー情報が含まれています。
- テキスト2の残りの要素がテキスト1に存在するか、少なくともそれらの大部分が存在することを検証します。
どのようなNLPテクニックがあるのかはよく分かりませんが、これはこのアプローチよりも優れていると思います。
を使用されてきたものの中に見つけることができます。それをもう一度確認できますか? – AgentX
今すぐ修正する必要があります。 – Daniel