cluster-analysis

    1

    3答えて

    私が使用しているデータセットは以下のとおりです。あなたが見ることができるように、k-meansクラスタ分析は、これらのクラスタの中心を容易に見つけると考えるでしょう。しかし 、私はクラスター分析をKが-意味し、私はこれを取得センターをプロットし実行します。 私は基本的な関数kmeansコード使用しています:関数kmeansについてはほとんど知られて事実が信頼性の高い結果を得るために、あなたは多くの

    -1

    1答えて

    類似行列を非類似行列に変換する方法は? 例: Point P1 P2 P3 P4 P1 1 0.8 0.65 0.55 P2 0.8 1 0.7 0.6 P3 0.65 0.7 1 0.9 P4 0.55 0.6 0.9 1 P1及びP2はクラスタ1にあり、P3とP4は、あなたの最大類似度が1である場合は、単に dissim(X、Y)= 1を使用することができるクラスタ2

    5

    2答えて

    私は既知のラベルを持つデータセットを持っています。私はクラスタリングを試み、既知のラベルによって与えられた同じクラスターを得ることができるかどうかを見たい。精度を測定するには、混乱行列のようなものを取得する必要があります。 私は分類問題のテストセットのために簡単に混同行列を得ることができます知っています。私はすでにthisのようにそれを試みました。それは分類問題のために理にかなっているラベルの同じ

    -1

    1答えて

    最大直径がしきい値として、できるだけクラスターが少ないセットのポイントをクラスタリングする最良の方法はありますか? たとえば、gpsポイントのセットと直径のしきい値が500mのものがあります。どのようにアルゴリズムを使用してクラスタの数を最小限にするか? 私はPythonを使用しているので、パッケージはまだありますか?

    0

    1答えて

    畳み込みニューラルネットワークのフィルタは、生データ(またはそれ以前のレイヤ)の特徴を抽出するため、バックプロパゲーションによる教師なし学習によってそれらを設計することは完全に意味があります。しかし、私は入力データサンプルの監督されていないクラスタリングによってフィルタが見つかるいくつかの論文を見てきました。クラスターセンターがフィーチャー抽出のための良いフィルターと見なされる方法は、私には奇妙に

    -2

    1答えて

    kモードが適用された後、すべてのクラスタのパラメータをどのように変化させるか? kモードのクラスタリングを適用し、CLUSPLOTを使用してクラスタをプロットし、クラスタが重なり過ぎるようになった。テストするには、すべてのクラスタで変数の分散を求める必要があるt検定を適用したいと考えました。しかし、我々は分類データを有するので、どのように分散を計算すべきか?

    0

    1答えて

    私はウィスコンシンの地図を取得しようとし、空間データポイントでClark-Evansテストを試みました。 Warning message: 244 points were rejected as lying outside the specified window 私は次のコードを使用:しかし、私はウィスコンシン州のマップをインポートし、窓に変換しようとすると、私はエラー会っ wisc.map <

    0

    1答えて

    私はPythonで、生のチャットデータとクラスターセンテンスを同様の意図で処理できるように開発しようとしています。そのため、新しいチャットボットを構築するためのトレーニング例として使用できます。目標はできるだけ迅速かつ自動(すなわち、手動で入力するパラメータなし)にすることです。 1-特徴抽出のために、私はそれぞれの文をトークン化し、その語をステミングし、SklearnのTfidfVectoriz

    0

    1答えて

    すべての発見的アプローチがあるかどうかを知りたいと思いますが、グループがあまり定義されていなければ、具体的にはUPGMAまたはアフィニティ伝播が繰り返し分析で異なる結果をもたらすかもしれません。 ヒューリスティックアプローチは最適を保証できない実用的な手法であるため、明確な最適化がない場合、それぞれの繰り返し解析で異なる解決策を得ることが可能です。 したがって、これはすべてのヒューリスティックなア

    -2

    1答えて

    このコードは、各クラスタのインデックスとソートのためのもので、クラスタ重心に最も近いn個(n = 6を選択)の単語を識別します。 とにかく、この種のエラーが見つかりました: 'float'オブジェクトに 'エンコード'属性がありません 誰でも助けてくれますか? コードは以下の通りです: from __future__ import print_function print("Top terms