例えば、私は入力としていくつかの意味的意味を持つ文章を入力しています。出力として、最も近い(余弦距離の)単語(たいていは単一単語)のリストを取得します。word2vecを使用してテキスト内で最も意味のある単語を見つけるにはどうすればよいですか?
しかし、私の文がどのクラスターに属しているのかを理解し、そこから各単語がどのくらい離れているのかを計算したいと思います。そして、意味のない言葉を文から排除する。
例:
「私はピザを購入したい」;
"ピザ":0.99123
"買う":0.7834
を "欲しい":0.1443
ような要件は、任意のCコーディングなしで、箱から出して実現することができますか?
多分私は余弦距離式を計算する必要がありますか?
ありがとうございました!