cluster-analysis

    1

    1答えて

    私は理解したいscipy.cluster.vq.kmeansです。 2次元空間に多くの点が分布しているため、問題はクラスタにグループ化することです。この問題は私の注目を集めてthis questionとなり、私はscipy.cluster.vq.kmeansが行く方法だと思っていました。 これはデータである:次のコードを使用して 、その目的は、25個のクラスタの各々の中心点を取得することであろう。

    -2

    2答えて

    私はここで短い質問があります。私はワンホットエンコーディングをいつ使うべきか、どのような状況でダミー変数を使うべきかを知りたい。 カテゴリ変数と数値変数を使用してクラスタリング分析を行う予定です。 1つのフォーラムで、ワンホットエンコーディングを使用してカテゴリ変数をエンコードしようとしています。しかし、ダミー変数とは何が違うのだろうか。 ありがとう

    -1

    1答えて

    予測分析にどのようにクラスタリングを使用できるかまだまだですか? 誰かがクラスターの抽出から未来を予測する方法を教えてもらえますか?

    -1

    2答えて

    以下に示すように、私は、84個の変数300人の観察とそれぞれとデータセットmydataを有する: Iはmydata 5におけるクラスタクラスタには、次のコードを使用しています:これは、生成 mydata <- read.csv("mydata.csv", header = TRUE) # K-Means Clustering with 5 clusters fit <- kmeans(myd

    -1

    1答えて

    私はユニークな問題があり、私の助けとなるアルゴリズムは認識していません。多分、ここの誰かがします。 私は、さまざまなソース(チーム)から集められたデータセットを持っています。特に、1つのフィールドは「タイプ」と呼ばれます。 APLE、りんご、APPLS、ornge、果物、オレンジ、オレンジZ、梨、 カリフラワー、colifower、brocli、brocoli、ネギ、野菜、野菜:ここではいくつかの

    0

    1答えて

    RのNbClustメソッドを使用して、Manningという本のアプローチに従ったクラスター分析で最適なクラスター数を決定しようとしています。 hclustで エラー(MD、メソッド= "平均"): はしかし、私はというエラーメッセージが表示されます クラスタへのn> = 2つのオブジェクトを持っている必要があります。 hclustメソッドが動作しているように見えますが。したがって、NbClustが

    -1

    1答えて

    これは本当に新しいですが、私はこれを行うためにK-meansを探していると思います。 タグが付いたオブジェクトがたくさんあります(多数)。他の機能のどれも重要ではありません。同様のオブジェクトには類似のタグがあり、それらを「カテゴリ」にグループ化することができます。私はこれらのカテゴリが何であるかを知りたいです(k-meansを使用していますか?)。タグのように見える... [u'taste 'u

    1

    1答えて

    ここ Link to the MIT problem set が私の現在の考えている - 私が間違っている場所を指すしてください:) 私は信じているもの:ホールドアウトセットの目的はトレーニングセットのために、 コントラストをくじくことですが - k-meansが各ラウンドでエラーを排除することを証明する。各 ポイントが持っている後、それは、各クラスタの中心部にあるように、各クラスタ の重心を再計

    0

    1答えて

    "ComplexHeatmap"パッケージを使用して、マトリックス内の相関ヒートマップを作成しています。 私は、私は以下のコードを実行するヒートマップの系統樹のために私自身のクラスタリングを使用したい: library(ComplexHeatmap); mat = matrix(rnorm(800),80,10); cor.mat= cor(mat) dist.mat = (1-cor.ma