2011-06-20 11 views
2

私の用途は次のとおりです。機能をクラスター化アルゴリズムのリストにすることは可能ですか?

私はWebリソースを持ち、リソースごとにそのビューのセットを持っています。それはウェブナビゲーションから来ているので、リソースはあなたが訪問したものであり、ビューは実際の訪問です。

ビューごとに、場所に関する情報、ビューの作成日時、ビューの総数、およびこのリソースに渡された時間などの情報を取得できます。

私は、この情報でさまざまなパターンを見つけて、ユーザープロファイルを特定したいと考えています。各リソースについて、ビューが1つしかない場合は、それらをクラスタ化するのは簡単ですが、多数のビューがあるので、この情報を使用してリソースをクラスター化する方法はありますか?

答えて

1

私が正しく理解していれば、自分が持っているビューに基づいてリソースをクラスタ化したいと思っています。これを行うには、ビューの統計に基づいてフィーチャーベクタを作成します。たとえば、あなたの特徴ベクトルには、ビューの総数、ビューアの場所の標準偏差、ビューの平均日時、リソースの年齢などが含まれます。次に、これらの特徴ベクトルをクラスタリングアルゴリズムに供給することができます。使用する正確な機能は、クラスタの用途やクラスタの用途によって異なります。クラスタにリソースの内容を反映させ、リソースがテキストベースである場合は、bag of wordsも使用することをお勧めします。

+0

ありがとう、これは私が探していたものです。私はstdev、avgなどのメトリックを計算しており、魅力的に機能しています。 –

0

正確に何を求めているのか分かりにくいです。はい、feature vectorsは機械学習アルゴリズムで広く使用されています。

関連する問題