2011-08-07 10 views
8

のセットのセットをあいまいにしたい。混合変数(カテゴリと数値)距離関数

  1. カテゴリ:位置、卒業証書、スキル
  2. 数値:給与、長年の経験

私の質問は:間の距離を計算する方法を ジョブズCEOはがある属性別の仕事?
例えばJOB1(プログラマ、BSコンピュータサイエンス、(Javaや.NET、責任)、1500年、3)
JOB2(テスター、BSコンピュータサイエンス、(黒と白のボックステスト)、1200,1 )

PS:私はデータマイニングクラスタリングの初心者です。ご協力いただきありがとうございます。

答えて

2

が良いいくつかの異なるクラスタリング方法のウォークスルーとどのようにRでそれらを使用することです。一般的にはhttp://biocluster.ucr.edu/~tgirke/HTML_Presentations/Manuals/Clustering/clustering.pdf

を、離散的なデータのためのクラスタリングが(例えばベクター中に重なって)カウントの使用のいずれかに関連していますまたはカウントから導出されたいくつかの統計に関連する。統計的な側面について言及したいと思うほど、私はあなたがアルゴリズムに興味を持っていると思うので、そのままにしておきます。