1

私はユーザータグの意味/類似性を見つけたいと思っています。ユーザタグ間の距離/類似度を求めるアルゴリズムはありますか?

各ユーザーは最大4つのタグを使用できます。たとえば、User-1 [機械学習]、[写真]、[データサイエンス]、[ニューラルネットワーク]、User-2 [機械学習]、[データサイエンス]、[統計]、[数学]ユーザー-2 [地球物理学、機械学習、アートと印刷、数学]

タグは幅広いスキルのものです。私はタグ間の距離/類似性を探したい。たとえば、「機械学習」、「データサイエンス」、「ニューラルネットワーク」は互いに近いでしょう。同様に「写真」と「アートと印刷」はお互いに近いでしょう。

私はword2vecを使用することを考えていました。しかし、私は数千種類のスキルセット文書を訓練しなければならないので、プロダクションで使用することを躊躇しています。実生活では、常にタグを変更/更新するだけでなく、だから私はユーザーのタグに従って調整される動的アルゴリズムを構築/開発したいと思っています。

私は機械学習の世界で初心者です。

答えて

1

すべてのタグはBitMap(BitSet)として表示できます。単一ビットは特定のユーザーがこのタグを持つかどうかを表します。次に、JaccardやOchiaiのようないくつかの類似関数を使うことができます

関連する問題