k-means

    -1

    1答えて

    私はH2Oに非常に慣れており、ハイブでモデルを実行しています。私がこの時点でH2Oを検討しているのは、H2Oがさまざまなモデリングプロセス(k-meansやロジスティック回帰など)中にデータ解析を最適化するのに役立つということです。私の質問は、私のpython(またはR)k-meansコードをH2Oで実行する方法か、H2Oの事前構築プロセスを使用する唯一の方法はありますか?それが後であれば、定期的

    0

    2答えて

    "kmeans"アルゴリズムで多次元関数オブジェクトをクラスタリングしようとしています。それはどういう意味なのですか?つまり、私は各行または個別のベクトルを持たないので、各Individualごとにさらに3x3の観測行列があります。例えば、Individual = 1は次のような観測値を持っています: (x1、 x3)、(y1、y2、y3)、(z1、z2、z3)である。 他の個人についても同じ構造

    0

    1答えて

    k-meansを使用してデータセットをクラスタ化しようとしています。アルゴリズムを1回だけ実行すると、ランダムクラスタが返されますが、複数の繰り返しを試すと0だけが返されます。私が使用している行列は、50k x 140の2進行列です。各行はユーザーを表し、各列は項目を表します。 def clusterizator(matriz, nDeClusters, it=10): # matrix, num

    -1

    2答えて

    8 clustersに集団をクラスタリングする必要があります。私はproc fastclusとk-meansメソッドを使用しています(クラスター間の分散を最小限に抑えるため)。観察はスコアを表すので、クラスタリングプロセスの後でさえ、それらは順序付けられたままであることが重要です。私はこのように気づいた: proc sort data=input.population; by score; r

    -1

    1答えて

    私はPythonを使ってK-meansを実践しています。 私は一連のショッピングデータを扱っており、入力データセットは次のようになります。 入力テーブルヘッダ: [ユーザID] [money_spent_on_clothes] int型 [money_spent_on_food] INT [money_spent_on_shoes] INT [money_spent_on_Monday] INT

    -5

    1答えて

    私はいくつかのクエリをクラスタリングするための線形方程式を持っており、ハイパーパラメータを調整したいと思います。今私は "k-means"クラスタリングに "グリッド検索"を使うことができますか?それともk-meansに使えないのですか? 私の研究では、私のデータを80-20の比率に分け、データの80%がモデルを訓練し、20%がそれをテストしました。 あなたは確実に予測値の品質を評価することができ

    0

    1答えて

    私は現在、機械学習には新しく、Machine Learningライブラリを使用して起こりうる異常について警告するプロジェクトに取り組んでいます。私はApache Sparkを使用する予定で、KMeansメソッドを使用してプロジェクトを解決することにしました。 主なプロジェクトは、毎日のファイルを分析し、いくつかのレコードの変動を検出し、それらを可能な異常として報告します(モデルに基づいて考えられる

    1

    1答えて

    私は理解したいscipy.cluster.vq.kmeansです。 2次元空間に多くの点が分布しているため、問題はクラスタにグループ化することです。この問題は私の注目を集めてthis questionとなり、私はscipy.cluster.vq.kmeansが行く方法だと思っていました。 これはデータである:次のコードを使用して 、その目的は、25個のクラスタの各々の中心点を取得することであろう。

    0

    1答えて

    よりも大きくなっている。 library(clValid) clValid(da_mat, nClust = 2:6,clMethods = "kmeans",method = "ward", validation = "internal",verbose = F,metric = "euclidean") 次の質問が表示されます。 アイテムの数がクラスタ化されます'maxitems'より大