cluster-analysis

    0

    1答えて

    私は約150,000のドキュメントの構造化されていないデータを持っています。私は教師なし学習アルゴリズムを使用してこれらのドキュメントをグループ化しようとしています。現在、gensim PythonでLDA(Latent Dirichlet allocation)を使用しています。 LDAModelについては、num_topics = 20を渡しました。したがって、私の全150kデータは20のトピ

    0

    1答えて

    クラスタリングをコミットするためにTDMのNA値で苦労しています。当初私は次のように設定しました: titles.tdm <- as.matrix(TermDocumentMatrix(titles.cw, control = list(bounds = list(global = c(10,Inf))))) titles.sc <- scale(na.omit(titles.tdm))

    -2

    1答えて

    私は、100万を超えるノード、エッジ、コミュニティを持つ巨大なデータセットを持っています。クラスタを示すネットワークグラフをプロットする最良の方法は何ですか。 私はCytoscapeを試しましたが、それは私が探しているものを提供していないようです。 私はPythonでプログラミングしてクラスタグラフをプロットするより良い方法を見つけようとしています。 任意の提案が高く評価されている...おかげで、

    0

    1答えて

    グラフが接続されており、エッジに重みがあります。エッジ間の重みが小さくなると、隣接する頂点がより近くなります。私はグラフをk個の小さな部分グラフに分割して、すべての部分グラフのノードが非常に似ているようにしたい。 つまり、グラフをクラスタリングする必要があります。誰かがグラフに適したクラスタリングアルゴリズムを提案し、時間の複雑さが少ない(O(n^2)より小さい)ことはできますか?

    1

    1答えて

    ピクセルで形成されたクラスタの重心を計算するにはどうすればよいですか? ピクセルをRED、BLUE、およびGREENの値(たとえば、pixel(116 133 55))で表しています。 重心はは、クラスタ内のインスタンスの平均である必要がありますが、はどのように私は、画素間の平均値を計算することができますか? [Iは、各色(重心[「RED」] = sum_red_pixel_values /画素数

    0

    1答えて

    私はcarr2のためのsolrのデフォルトのクラスタリングコンポーネントを探していました。 finishStage方法で オーバーライドされた処理方法で SolrDocumentList solrDocList = SolrPluginUtils.docListToSolrDocumentList( results.docList, rb.req.getSearcher(), engine.get

    0

    3答えて

    2つの変数を持つデータにK平均(またはその他の単純なクラスタリングアルゴリズム)を適用したいですが、クラスターが条件を満たすようにします。 これは可能ですか?

    0

    2答えて

    私は、緯度/経度データ速度の車両IDなどを持つGPSデータに取り組んでいます。 道路の各側で毎日異なる時間車速が異なります。 Iはplotly mapboxと色差と、このグラフは、車両の速度に関連して作成されました。 私の質問は何ですか?私は車の側を見つけるために任意のクラスタアルゴリズムを使用できますか?私はDBSCANを試しましたが、明確な答えが見つかりませんでした。