2012-01-10 20 views
2

候補のクラスタまたはノードのグループ(ここではフォーラムメッセージ)を検索しようとしています。隣接行列/エッジリストからクラスタを生成するR

現在のデータでは、各ノード(メッセージ)は他のn個のメッセージと一緒に暫定的にグループ化されており、そのグループには名前が付けられています。だから、私たちは、msg ID 1がmsg ID 3、7と一緒に見えていることを知っています。

私は現在、その情報を使ってエッジリストを作成しています(それらがグループ化されていてエッジが存在する場合)。そしてウォークトラップコミュニティを使用してデンドログラムを生成します。

エッジリストを指定すると、他の方法でグループやクラスタを試してみることはできますか? (私はRを使用していますが、何かへのポインタが役に立つでしょう)。

ありがとうございました!

答えて

3

私はRについて多くを知らないが、...

This overview paperは非常に詳細にグラフのクラスタリングについて説明します。また、Markov clustering(MCL)アルゴリズムに興味があるかもしれません。

1

Rのネットワーク解析では、igraphの使用をお勧めします。あなたはすでにそれを使用していますか?それは異なるクラスタリング方法を使用して樹形図の構築を可能にする。次に、community.to.membership()を使用して樹形図をカットします。 MCLアルゴリズムは(まだ)igraphから入手できませんが、コマンドラインからかなり簡単に実行できます。

1

一般的なキャッチオール方式は、データの隣接行列を構築し、行列乗算を使用して一種の推移的閉包を構築した後、 「理由」を識別するために逆行列を計算するか、またはグループを識別するためにPCA/ICAを計算する。

関連する問題