cluster-analysis

    -3

    2答えて

    行と列のクラスタリングを同じにするにはどうすればよいですか(ペアワイズ行列でグループを見つけるなど)。 ドキュメントでは、行または列のクラスタリングをオン/オフにできますが、それは互いに独立しています。

    2

    2答えて

    私はちょうどピークがあるべき場所、それが判断するほとんど不可能ですが、ggplotで2D密度平滑で描かれた場合、私はこれらを取得するだけで、データポイントでデータ/プロットの次のタイプ 探しています本当に素敵な山々。私が目にするのは、〜10点のグループを見つけたいと思っています。 「有効なグループ」の正確な数は、もちろん議論のために上がっています。ここ データ: https://pastebin.

    0

    1答えて

    私は、どのように食物が相互に相関しているかをピアソン相関行列で表しています。 一緒に分析できる食品のグループを作りたいので、それらをクラスターに分類したいと思います。 私は次の基準を使用してカテゴリにこれらの食品をクラスタ化する: 1)私は、クラスタ 2の各内相関を最大化したいと思います)私は(セットアップに各グループの最小相関をしたいと思いますすなわち、各クラスタは> 0.7の相関を有する必要が

    0

    2答えて

    とLPPに私は最近、「Rに非常にnewie」これを行うための正しい方法についての質問を掲載しているあなたがそれに興味がある場合は、[こちら]それを見つけることができます。 1 私は今、仕事をして、簡単なRスクリプトを開発するために管理しているが、今の結果は、私に困るものです。私はmad.test .That機能をlpp(リニアポイントパターン)を分析するためにRを使用してい ロングストーリー短いは

    0

    3答えて

    私はdoc2vecを使用して、フォロワーのトップ100のつぶやきをベクトル表現(たとえば、v1 ..... v100)に変換しています。その後、私はK-Meansクラスタを行うためにベクトル表現を使用しています。 model = Doc2Vec(documents=t, size=100, alpha=.035, window=10, workers=4, min_count=2) クラスタ0

    1

    2答えて

    シルエットスコアを使用して自分のデータセットに最適なクラスター数を選択したいと思います。私のデータセットは、このブランドを購入した顧客の数、ブランドの売上、ブランドが各カテゴリで販売する商品の数を含む2,000以上のブランドに関する情報です。 私のデータセットはまれであるため、クラスタ化する前にMaxAbsScalerとTruncatedSVDを使用しました。 私が使用しているクラスタリング方法は

    -2

    1答えて

    すべての列が数値ではないため、異なるデータ型の列(ProductId、Name、size、color、class、deptなどの列)を持つ表があります。一緒に。データはNetezzaに格納されていますが、高速処理のためにデータ量が膨大なため(約200万行)、DB側でのみ実行したいと考えています。 RでGowerの類似性を実装しようとしましたが、時間がかかります。 Netezza側で使用できるUDF

    -1

    1答えて

    私は数多くの学生がいるので、それらをグループに分けたいと思います。私は生徒に5つのスキルを測定しました。目標は、すべてのグループが各スキルに匹敵するレベルのような方法でグループに学生を割り当てることです。言い換えれば、私はスキルのそれぞれをグループにまたがって配分し、いくつかのグループに集中させたくないということです。どのような統計的分析がこれを行うかもしれないか?好ましくはSPSS

    -1

    1答えて

    Iはgowallaデータセットを使用して場所をクラスタ化する。[これは私のデータであるユーザID(int)を含有し、チェックイン時間(多項式)、緯度(実)、経度(実)、位置(INT)] そして私はこのようなエラーがあります。 私のコードに何が問題なのですか? import csv import numpy as np from scipy.spatial import distance fr

    -1

    1答えて

    と元のクラスタセンター/重心を得る私は戻って結果を書き込むk平均モデル val kmeans = new KMeans().setK(k).setSeed(1L) val model = kmeans.fit(train_dataset) 、次いで抽出クラスタの中心(重心) var clusterCenters:Seq[(Double,Double,Double,Double,Double,