私は約10個のオブジェクトのセットを持っています。それぞれ約150個の別個のプロパティがあり、そのうちの約4分の1は多値および/または他のプロパティと関連しています。オブジェクトをそのプロパティに基づいて分類するアプローチを探しています
私はこれらのオブジェクトを「テンプレート」オブジェクトとして定義された状態で並べ替えるために、約120種類のカテゴリを用意しています。インスタンスがテンプレートと正確に一致する場合、そのオブジェクトは明らかにそのカテゴリ内にあります...しかし、オブジェクトの約10%だけが実際に完全一致のテンプレートを持っています。結果として、私はカテゴリーとの類似性に基づいてオブジェクトにスコアを付け、それらを最もよくマッチさせたいと思っています。また、非常に似ているオブジェクトのクラスターを特定し、新しい/洗練されたカテゴリーの可能性を示したいと思います。
これは、Weka、RapidMiner、または他の機械学習/クラスタリング/分類システムの仕事のようです。しかし、私はこのドメインに優れた紹介資料を見つけるのが難しく、その結果、これらのツールを使用するためにどれだけの労力がかかるか分かりません。これは継続的な必要性があることを考えると、分析方法や重量などを簡単に変更できるものを使用したいと考えています。
思考?