2017-05-23 4 views
0

グループ化されたデータをクラスタ化するのにPyMC3を使用しています。基本的には、g個のベクトルを持ち、g個のベクトルをm個のクラスタにクラスタリングしたいと考えています。しかし、私には2つの問題があります。グループ化されたデータに対して、PyMC3のDirichletプロセスからクラスタIDを抽出するにはどうすればよいですか?

最初の1つは、PyMC3がベクトルではなく1次元データしか扱えないと思われることです。 2番目の問題は、生データのクラスタIDを抽出する方法がわかりません。私は成分の数(k)と対応する重みを抽出します。しかし、私は、それぞれのポイントが属するクラスターを示すIDを抽出できませんでした。

すべてのアイデアやコメントが歓迎されます!

答えて

0

私が正しく理解している場合は、データポイントが属するカテゴリ(1〜k)を抽出しようとしています。しかし、ディリクレ確率変数は確率ベクトルを生成するだけである。これは、分類RVのために事前に使用されるべきであり、それがサンプリングされたときに番号付きカテゴリになる。

関連する問題