cluster-analysis

    1

    1答えて

    こんにちは私は妥当な答えを与えた以前の質問をしました。私はトラックに戻ってきたと思いました。Fuzzy c-means tcp dump clustering in matlab問題は以下のtcp/udpデータの前処理段階です私の質問: 1)どのように私は、またはどのように数値データにセル内のテキストデータを変換する最良の方法は?数値はどうなるべきですか? 編集: Excelの私のデータは次のよう

    27

    1答えて

    私はclojure(Mahoutクラスの呼び出し)を介してデータをクラスタリングする短いスクリプトを作成しようとしています。私は #!./bin/clj (ns sensei.sequence.core) (require 'clojure.string) (require 'clojure.java.io) (import org.apache.hadoop.conf.Configu

    8

    2答えて

    私はK-Meansと共にCanopyクラスタリングアルゴリズムを実装しようとしています。私はCanopyクラスタリングを使用してK-meansにフィードするための最初の開始点を得ると言っているオンライン検索を行っていますが、Canopyクラスタリングでは、天蓋に2つのしきい値T1とT2を指定する必要があります。内側の閾値の点はそのキャノピーに強く結びついており、より広い閾値の点はそのキャノピーに結

    9

    3答えて

    私は、k-meansクラスタリングアルゴリズムのJavascript実装が必要です。私は1次元のデータしか持っていませんが、100以上のアイテムはほとんどありませんので、パフォーマンスは問題になりません。 PS:私はoneしか見つけることができませんでしたが、それは非常に不安定で、ほとんどすべての呼び出しでまったく別のクラスターになりました。

    5

    3答えて

    距離行列を入力として受け取り、各要素を含むクラスタを最大でそれぞれ "x"離れた距離に置くオープン/フリー密度ベースのクラスタリングライブラリを見つけるのに役立つ必要がありますクラスタ内の他の要素(基本的に指定された密度のクラスタを返す)。 私はDBSCANアルゴリズムをチェックアウトしましたが、私のニーズに合っているようです。 DBSCANのクリーンなインプリメンテーションは、あらかじめ計算され

    3

    4答えて

    私は5千万のテキストスニペットを持っており、それらからいくつかのクラスタを作成したいと思います。次元は60k〜100kの間のどこかにあるかもしれません。平均テキストスニペットの長さは16ワードです。あなたが想像することができるように、周波数行列はかなり疎です。私はこれらのクラスタを見つけることができるソフトウェアパッケージ/ libray/sdkを探しています。私は過去にCLUTOを試していました

    1

    1答えて

    のクラスタのタイトル(クラスタの中心)を選択しますタイトルは'黄色の熟したバナナ'です。 現在のところ、SQL GROUP BYの助けを借りて、最も一般的なものを選択するか、またはネクタイの場合は最短の名前を選択するという簡単なヒューリスティックを使用しています。私のデータには大量のクラスタが含まれており、頻繁に変更され、新しいフルーツがクラスタに追加または削除されるたびに、クラスタのタイトルを再

    1

    1答えて

    私はクラスタの問題を抱えており、Rのproxyパッケージはdistとsimilの両方の機能を提供しています。 は私の目的のために私は距離行列を必要とするので、私は最初にdistのを使用し、ここでのコードです: distanceMatrix <- dist(dfm[,-1], method='Pearson') clusters <- hclust(distanceMatrix) cluster

    5

    2答えて

    特定のデータセットの実行ごとに同じkmeansクラスタを取得できますか?ランダムな値の場合と同様に、固定されたシードを使用できます。クラスタリングのランダム性を停止することは可能ですか?

    0

    1答えて

    私はMahoutとLuceneを使って新しいです。私はあらゆるフォーラムと質問をしましたが、私はまだいくつかのことを理解することはできません。 TermVectorsを使ってLuceneのインデックスを作成しました。しかし、私はMahoutを使用してその情報をクラスタ化する必要があります。 誰もがコマンドを使用していることがわかりました。私のプロジェクトは、Windows環境でNetBeansを使