hierarchical-clustering

0熱

1答えて

これは多分疑問な質問ですが、私は対象を見つけることができません。私のデータにplantという3つのクラス（varieties）があり、クラスタ分析を行っています。 cut.complete <- cutree(cluster.complete,k=3) cc <- table(variety,cut.complete) cc cut.complete variety 1 2 3

0熱

1答えて

pvclust Rパッケージで "ward"メソッドを使用するとエラーが発生する

pvclustパッケージを使用してクラスタ分析に関するいくつかの問題が発生しています。具体的には、種（行）とサンプリングステーション（列）で構成されるデータマトリックスがあります。私は私の種の豊富さ（私は以前にlog（x + 1）を変換していた）に従ってサンプリングステーションをグループ化するためにCAを実行したい。私の行列を適切に準備したら、WardのクラスタリングメソッドとBray-Cur

0熱

1答えて

クラスタソリューションと変数の間で相関分析を実行するにはどうすればよいですか？

私は教授がSPSSで数種類の分析を説明しているのを見たことがあります。同じ結果を導いた同じ分析を実行する必要がありますが、その方法は分かりません。次の分析（SPSSの機能または手順）を実行する方法についてアドバイスできますか？ 1）クラスタ分析（Wardの方法を使用）後、出力表に各クラスタの頻度が示され、クラスタ1にはX番号があり、クラスタ2にはY番号があります。 2）より困難な部分は、Rの二乗相

-2熱

1答えて

分裂的クラスタリングの実装

これは、paperを参照しています。その論文では、文書を分類する前に単語をクラスタリングしています語彙サイズが35000の文書セットから、50クラスタだけを使って文書を78％の精度で分類できると言われています。（論文の図5）彼らは分割クラスタリングアルゴリズムを使用しています。私はそのアルゴリズムの実装を探してきました。しかし、私は何も見つけることができませんでした。ここで、そのアルゴリズ

-1熱

1答えて

相関係数にPythonを使用した階層的クラスタリング

50個のジャーナルを50個のマトリックスで表し、相関がある50個のマトリックスを持つデータがあります。今、50のジャーナルがデータに基づいてどのクラスターに属するかを示すグラフをプロットしようとしています。 1）クラスタを行うには、完全リンケージまたはワードの方法を使用することをお勧めします。 2）私はscikit-learnのドキュメントが私にとっては技術的すぎるので、クラスタリングを開始する場

1熱

1答えて

変数が使用されているSPSSでデータファイルを取得するにはどうすればよいですか？

私はデータセットを持ち、クラスタ分析を実行するためにSPSSを使用しました。どの段階とステップがどの変数を表しているかを知るために、どの変数がクラスタ分析を実装するために使用されたかを示すデータファイルを用意する必要があります。私はクラスタソリューションを保存しましたが、それは役に立ちませんでした。この目的のために必要なデータファイルを取得するために実行すべきアクションまたはステップはどれですか？

-1熱

1答えて

2つのクラスタ間のダイヤル

私はするべきことがありますが、それを行う方法についてアドバイスが必要です。私のデータポイントは1,2,9,6,4です。クラスター間の距離を計算する必要があります。ユークリッド距離が必要です。私の答えは、{1,1} = 0. {1,2} = 1、{1,9} = 8.私は正しいことをしていますか？

3熱

1答えて

ValueError：Linkage 'Z'はPython scipy fclusterで同じクラスタを2回以上使用します

ValueError: Linkage 'Z' uses the same cluster more than once.は、scipy.cluster.hierarchy.fclusterを使用してPythonでフラットクラスタを取得しようとしています。このエラーは、たまにしか発生しません。通常、実際には大きな行列、つまり10000x10000でのみ発生します。 import scipy.clu

0熱

2答えて

ダミーコード付き変数Rを使用したクラスタ分析

データセットに対してクラスタ分析を実行しようとしていますが、適切な洞察を見つけることができません。例：私は100のリソース（列）の中から50の変数（行）のセットを持っています。各リソースには、強度としての変数と弱点としての変数があります。私は、強さを1、弱さを2としました。各リソースは強度として10変数しかなく、弱さとして5変数になる可能性があるので、残りの変数はゼロとしてマークされます。今、共通

-1熱

1答えて

クラスタの数を指定するR

Rを手動で指定せずに生成されるクラスタの数を判断する方法はありますか？文字列の値から「文字」を抽出した後、30000個の異なる値を持つ変数をクラスター化して、どの値を同じように扱うべきかを判断しました。おそらく同じであるが、空間に例えば句読点等を異なる値があるので、 Emilia Clarke Emilia Clark e は、私は1つの距離である要素と30000 X 30000行列を生成