k_meansを使用する以外のPythonでのテキストクラスタリング

sklearnのk_meansはテキスト間の距離や類似性の測定値ではないユークリッド距離を使用するだけなので、テキストクラスタリング '？k_meansを使用する以外のPythonでのテキストクラスタリング

2017-05-18 user6396

scikit-learnで実装されているクラスタリング方法のいずれかを使用できます。[here]（http://scikit-learn.org/stable/modules/clustering.html）を参照してください。たとえば、[階層的クラスタリングアルゴリズム]（http://scikit-learn.org/stable/modules/clustering.html#hierarchical-clustering）を使用して、 – patrick

他のメトリックを使用する場合は、K-Medoidsを選択するとよいでしょう。それはK-Meansに似ていますが、更新の段階で平均の代わりに中央値を使用します。これは、任意の距離メトリックの使用を可能にする。

this scikit-learnプルリクエストで便利で使いやすい実装が利用可能です。

出典

2017-06-18 11:49:42 mibarg

k_meansを使用する以外のPythonでのテキストクラスタリング

答えて

関連する問題