0

サインアッププロセスの回答に基づいてユーザーをさまざまなグループに分類する際のアドバイスを探しています。機械学習のシナリオでユーザーを分類するためのアドバイス

これらの分類では、似たような旅行習慣を持つ人々、つまり冒険的でリラックスした食べ物などをグループ化するという考えがあります。これはユーザーに知られている分類であってはなりません。彼らが好きな休日(ポイントはあなた自身を置くべき場所を実際に知っていないユーザーバイアスを削除することです)。

ソーシャルメディア(gopro、レストランなど)でやりとりしたり、シナリオを与えたり、どの音が最もよく聞こえるかを聞いたりするなど、使用しているアプリなどの質問をしています。したがって、我々は変数を制御する。私が持っている主な問題は、これらのそれぞれに関連付けられた数値を取得する方法です。

私は様々な機械学習アルゴリズムを調べてきましたが、これはクラスタリングの問題の可能性が高いと認識していましたが、このスタイルの質問を使用して実際に役立つ各次元に値を割り当てる方法分類。

私が持っているもう1つの質問は、ユーザーにこのような分類を許可する情報を得るように質問するための情報の種類があるかどうかです。

私が想定しているプロセスの種類は、誰もが慣れている場合はhttps://www.thread.com/signup/introductionに似ています。

アドバイスをお待ちしています。

答えて

0

あなたが手にしている問題は、アプリ、アカウントなどの選択肢であるカテゴリ変数に基づいて類似度を計算したいということです。これらのアプリの類似性をどのように食べ物がアプリであるかは、指定するのが難しい問題です。また、カテゴリ変数がこのような類似度を作成するために想定できるすべての可能な状態を知る必要があります。 最終的な目的が、類似した人々(アプリの選択やソーシャルメディアアカウントの選択に基づいて)が好きだったり楽しんだことをお勧めする場合は、コラボレーションフィルタリングを調べる必要があります。 フィーチャスペースが明確に定義され、スタティック(既知のアプリ、既知のアカウント、欠損値の少ない限定セット)の場合は、コンテンツベースの推奨システムを調べます。マーケットバスケット分析と同じように簡単なことは、 そうでない場合は、ランダムな状態を想定できる一連の機能を持つシステムを実際にモデル化したい場合は、多変量確率モデルで構造を(構造間の関係や影響)よく定義すれば、Probabilistic Graphicalベイジアンネットワークなどのモデル。 問題を解決する前に、問題をよりよく定義する必要があります。

+0

申し訳ありませんが、私はアプリ/アカウントなどが所定のセットからなるはずだと言いました。市場バスケット分析 –

0

素数を使用できます。選択可能なすべての選択肢のリストの各選択肢に異なる素数が割り当てられ、ユーザーの選択が製品として保存されている場合、選択/選択のモジュロが0の場合にユーザーが特定の選択を行ったかどうかが常にわかります。素数の、

+0

本当に賢い、ありがとう!意思決定ツリーのように決定する選択肢が「厳密」ではないが、複数のルートが同じ分類を与えることができるようにすると、モデルを作成するのにどのように使用することができますか? –