2009-05-02 5 views
7

多次元データのクラスタリングをサポートするC/C++機械学習ライブラリとは何ですか? (例えば、K-手段用)クラスタリングのためのC/C++機械学習ライブラリ

これまでのところ、私はロール私-自身のように誘惑しています

  • SGI MLC++ http://www.sgi.com/tech/mlc/
  • OpenCVのMLLに遭遇しましたが、私は既存のものは、パフォーマンスが最適化されており、コードをより多く目にしています。

答えて

8

The Open Source C Clustering Library東京大学のヒトゲノムチームから有望視されている。これには、K-meansや他のフラットな階層的クラスタリングアルゴリズムがあります。 GUIなしで裸のライブラリのページを下にスクロールします。 The Wikipedia-Clustering projectはよかったと少し軽いようです。 Here's a specialized K-means library from The University of Mariland。 あなたのデータの種類を考慮して、これらを見てみることをお勧めします。特徴ベクトルを作成する前処理データは困難かもしれない。

2

C4.5、ID3などのアルゴリズムを探しているかどうかわかりません。そうした場合、個々の情報源を大学のウェブサイトからダウンロードして、積極的に調査しています。

例:C4.5ソースはQuinlan's websiteにあります。