cluster-analysis

0熱

1答えて

私は約150,000のドキュメントの構造化されていないデータを持っています。私は教師なし学習アルゴリズムを使用してこれらのドキュメントをグループ化しようとしています。現在、gensim PythonでLDA（Latent Dirichlet allocation）を使用しています。 LDAModelについては、num_topics = 20を渡しました。したがって、私の全150kデータは20のトピ

0熱

1答えて

クラスタリングのためにTDMからNA列を削除する方法

クラスタリングをコミットするためにTDMのNA値で苦労しています。当初私は次のように設定しました： titles.tdm <- as.matrix(TermDocumentMatrix(titles.cw, control = list(bounds = list(global = c(10,Inf))))) titles.sc <- scale(na.omit(titles.tdm))

-2熱

1答えて

クラスタ化されたネットワークをプロットする最善の方法

私は、100万を超えるノード、エッジ、コミュニティを持つ巨大なデータセットを持っています。クラスタを示すネットワークグラフをプロットする最良の方法は何ですか。私はCytoscapeを試しましたが、それは私が探しているものを提供していないようです。私はPythonでプログラミングしてクラスタグラフをプロットするより良い方法を見つけようとしています。任意の提案が高く評価されている...おかげで、

0熱

1答えて

グラフをk個の類似した部分グラフに分割する

グラフが接続されており、エッジに重みがあります。エッジ間の重みが小さくなると、隣接する頂点がより近くなります。私はグラフをk個の小さな部分グラフに分割して、すべての部分グラフのノードが非常に似ているようにしたい。つまり、グラフをクラスタリングする必要があります。誰かがグラフに適したクラスタリングアルゴリズムを提案し、時間の複雑さが少ない（O（n^2）より小さい）ことはできますか？

1熱

1答えて

ピクセルクラスタの重心を見つける

ピクセルで形成されたクラスタの重心を計算するにはどうすればよいですか？ピクセルをRED、BLUE、およびGREENの値（たとえば、pixel(116 133 55)）で表しています。重心はは、クラスタ内のインスタンスの平均である必要がありますが、はどのように私は、画素間の平均値を計算することができますか？ [Iは、各色（重心[「RED」] = sum_red_pixel_values /画素数

0熱

1答えて

solrクラスタリングコンポーネントはどのように機能しますか？

私はcarr2のためのsolrのデフォルトのクラスタリングコンポーネントを探していました。 finishStage方法でオーバーライドされた処理方法で SolrDocumentList solrDocList = SolrPluginUtils.docListToSolrDocumentList( results.docList, rb.req.getSearcher(), engine.get

0熱

3答えて

Kは条件付きであることを意味します

2つの変数を持つデータにK平均（またはその他の単純なクラスタリングアルゴリズム）を適用したいですが、クラスターが条件を満たすようにします。これは可能ですか？

0熱

2答えて

道路上の車両の方向を見つける

私は、緯度/経度データ速度の車両IDなどを持つGPSデータに取り組んでいます。道路の各側で毎日異なる時間車速が異なります。 Iはplotly mapboxと色差と、このグラフは、車両の速度に関連して作成されました。私の質問は何ですか？私は車の側を見つけるために任意のクラスタアルゴリズムを使用できますか？私はDBSCANを試しましたが、明確な答えが見つかりませんでした。