2017-11-28 1 views
0

問題:リストのタイトルのみに基づいてユーザーにタグを提案するにはどうすればよいですか?

タグは、作成しようとしているリストのタイトル(5-15単語)のみに基づいてユーザーに提案する必要があります。

私たちは約30所定のタグが持っている - だから、

Gaming, Movies, TV shows, Documentaries, Books, Music, Art, History, People, Adventure, Sports, Cooking, Travel, Places, Food, Drinks, Fitness, DIY, Technology, Science, Cars, Bikes, Comedy, Shopping, Clothes, Fashion, Photography, Nature, etc. 

を、例えば、タイトルとのリストについては、「世界中で最も高価な微ダインのレストラン」提案タグ (かもしれません食べ物、場所、飲み物、旅行)

非常に正確である必要はありません。十分にうまくいく必要があります。ユーザーからより多くのトレーニングデータが届くようになります。教師あり学習のための訓練データはまだありません。

機械学習と自然言語処理の膨大なスペースで自分自身を失ってしまった。この特定のタスクにどのメソッド/アルゴリズム/ライブラリを使用すべきか、そしてその前にバックグラウンドで行うべきことを誰かが提案できるなら、非常に役に立ちます。

ありがとうございます。

答えて

1

word2vecを使用できます。あらかじめ用意されたモデルを取得し、タグのベクトルを計算します。次に、新しいタイトルのベクトルを計算します。タイトルベクトルと各タグベクトルとのコサイン類似度を求める。説明タグのために、タイトルとの類似性がある閾値を上回るようにしてください。

+0

文章のベクトルを計算するにはどうすればよいですか?私が行う方法を知っているステップの残り – Optimus

関連する問題