cluster-analysis

1熱

1答えて

私は理解したいscipy.cluster.vq.kmeansです。 2次元空間に多くの点が分布しているため、問題はクラスタにグループ化することです。この問題は私の注目を集めてthis questionとなり、私はscipy.cluster.vq.kmeansが行く方法だと思っていました。これはデータである：次のコードを使用して、その目的は、25個のクラスタの各々の中心点を取得することであろう。

-2熱

2答えて

ワンホットエンコーディングを使用するタイミングとダミー変数を使用するタイミング

私はここで短い質問があります。私はワンホットエンコーディングをいつ使うべきか、どのような状況でダミー変数を使うべきかを知りたい。カテゴリ変数と数値変数を使用してクラスタリング分析を行う予定です。 1つのフォーラムで、ワンホットエンコーディングを使用してカテゴリ変数をエンコードしようとしています。しかし、ダミー変数とは何が違うのだろうか。ありがとう

-1熱

1答えて

予測分析にクラスタリングを使用できますか？

予測分析にどのようにクラスタリングを使用できるかまだまだですか？誰かがクラスターの抽出から未来を予測する方法を教えてもらえますか？

-1熱

2答えて

なぜk-meansはRの変数ではなく観測値をクラスタリングするのですか？

以下に示すように、私は、84個の変数300人の観察とそれぞれとデータセットmydataを有する： Iはmydata 5におけるクラスタクラスタには、次のコードを使用しています：これは、生成 mydata <- read.csv("mydata.csv", header = TRUE) # K-Means Clustering with 5 clusters fit <- kmeans(myd

-1熱

1答えて

テキストデータを使用した正規のクラスの決定

私はユニークな問題があり、私の助けとなるアルゴリズムは認識していません。多分、ここの誰かがします。私は、さまざまなソース（チーム）から集められたデータセットを持っています。特に、1つのフィールドは「タイプ」と呼ばれます。 APLE、りんご、APPLS、ornge、果物、オレンジ、オレンジZ、梨、カリフラワー、colifower、brocli、brocoli、ネギ、野菜、野菜：ここではいくつかの

0熱

1答えて

NbClustのエラー：クラスタに十分なオブジェクトがありません

RのNbClustメソッドを使用して、Manningという本のアプローチに従ったクラスター分析で最適なクラスター数を決定しようとしています。 hclustでエラー（MD、メソッド= "平均"）：はしかし、私はというエラーメッセージが表示されますクラスタへのn> = 2つのオブジェクトを持っている必要があります。 hclustメソッドが動作しているように見えますが。したがって、NbClustが

-1熱

1答えて

タグをk-meansのカテゴリにクラスタ化する

これは本当に新しいですが、私はこれを行うためにK-meansを探していると思います。タグが付いたオブジェクトがたくさんあります（多数）。他の機能のどれも重要ではありません。同様のオブジェクトには類似のタグがあり、それらを「カテゴリ」にグループ化することができます。私はこれらのカテゴリが何であるかを知りたいです（k-meansを使用していますか？）。タグのように見える... [u'taste 'u

1熱

1答えて

k-meansクラスタリングにおけるホールドアウトセットの目的は何ですか？

ここ Link to the MIT problem set が私の現在の考えている - 私が間違っている場所を指すしてください:) 私は信じているもの：ホールドアウトセットの目的はトレーニングセットのために、コントラストをくじくことですが - k-meansが各ラウンドでエラーを排除することを証明する。各ポイントが持っている後、それは、各クラスタの中心部にあるように、各クラスタの重心を再計

0熱

1答えて

"ComplexHeatmap"パッケージを使用したヒートマップ樹状図

"ComplexHeatmap"パッケージを使用して、マトリックス内の相関ヒートマップを作成しています。私は、私は以下のコードを実行するヒートマップの系統樹のために私自身のクラスタリングを使用したい： library(ComplexHeatmap); mat = matrix(rnorm(800),80,10); cor.mat= cor(mat) dist.mat = (1-cor.ma