2012-03-13 6 views
0

ピアソン相関スコアなどの類似性ベースのアルゴリズムを使用して2つの特徴ベクトル を比較し、フィーチャセット間で非常に異なるこれらの次元/フィーチャフィールドを知りたい場合使用するアルゴリズムは何ですか?私はMahoutを使用しています。これは、Java用のライブラリを学習するマシンです。Mahoutの特徴ベクトルで異なる次元を見つける

+0

これはプログラミングに関する質問ではありませんか? – specialscope

+0

私はMahoutを使用しています。これはJavaのライブラリを学習しているマシンです – seahorse

+0

ここでフィードバックを得たい場合は、あなたの質問に言及し、おそらくあなたも同様に作業しているコードを投稿してください。 – specialscope

答えて

1

まあ、2つのベクトルが最も異なる次元になります。次元のベクトル値の差の絶対値は最大。それは本当にすべての意味ですか、それとも微妙なものをお探しですか?

+0

私はfv1、fv2、fv3、fv4、fv5を非常に "似ている"と思われる特徴ベクトルとして持っています。今度は、フィーチャ・ベクトル2 = fv2(たとえば)に対して、他の次元と比較して、どちらの次元が厄介であるか、または不均一性の大きな変化を見つける必要があります。このために、fv2を他のすべての特徴ベクトルと比較してから、answer.Soを計算して、すべてのベクトルの平均絶対差を計算する必要がありますか、いくつかのより良い統計がありますか? – seahorse

+1

平均との絶対差は妥当です。私はz値のように標準化された何かを示唆するかもしれません - 値が平均値からの標準偏差の数だけです。 –

関連する問題