検索用語のリストを「記入」するアルゴリズム(自然言語処理技術に依存していると思われます)を記述しようとしています。私が気付いていないこの種の名前がおそらくあります。この種の問題は何と呼ばれ、どのようなアルゴリズムが私に次のような振る舞いを与えますか?検索用語を入力するNLPアルゴリズム
入力:
docs = [
"I bought a ticket to the Dolphin Watching cruise",
"I enjoyed the Dolphin Watching tour",
"The Miami Dolphins lost again!",
"It was good going to that Miami Dolphins game"
],
search_term = "Dolphin"
出力:
["Dolphin Watching", "Miami Dolphins"]
それは基本的に「ドルフィン」はまったく表示された場合、それは事実上、常にどちらかのバイグラムで「イルカウォッチング」だか「マイアミのことを把握すべきですイルカ "。 Pythonのソリューションが好ましい
イルカがバイグラム "イルカウォッチング"または "マイアミドルフィンズ"の一部であることをどのように知っていますか?それぞれのバイグラムの両方の単語が大文字になっているからですか?あるいは、あなたが望むバイグラムを含む別のリストを持っていますか? –
@RobertHarvey:良いNLPアルゴリズムは[Miami Dolphins]を単語として解析できるはずです。 [Dolphin Watching]と同じです。それぞれのフレーズを質問として作成した場合のように考えるのは簡単です。 Q:「あなたはどんなツアーを楽しんでいましたか?」 A:[Dolphin Watching]ツアー、Q:誰がゲームを失ったのですか? A:[マイアミドルフィンズ]。あなたはそれを木に解析して、何が何に属するのかを調べる必要があります。簡単な問題ではありませんが、いくらか正確な結果を得ることができます。 – mpen
@RobertHarvey私は特定の言葉のリストを持っているので、私はドルフィンがどこかにいなければならないことを知っています。 – Trindaz