2010-12-08 1 views
0

私は無料のパッケージであるRSARを試しましたが、そこに他の良い属性の減耗剤があるのだろうかと思います。 Rやmatlabのパッケージであっても、データを明確化する最小限の属性を見つけることができるリソース。たとえば、何百ものメールの例とそれらを記述し、スパムであるかスパムではないという異なる属性を持つセットを持つと、無駄な情報を捨てるために、すべてのデータを記述する最小限の属性を見つける必要があります。ラフなセットベースの属性削減

私は自分自身をexpalined、私はあなたの提案に開いていない場合は、私は希望です。

ありがとうございました。

答えて

0

あなたが記述する問題のタイプを考慮すると、メールの分類に適切な属性を選択すると、Weka(Weka home)を使用するのが最善の方法です。これには、効果を視覚化するためにインタラクティブに、またはさまざまな分類アルゴリズムと組み合わせて適用して、実際の分類に及ぼす影響を評価する、いくつかの機能選択アルゴリズムがあります。 (特定の分類子に対して適切な検証を行わずに分類のために属性を選択すると、実生活では最適な結果が得られない可能性があることに注意してください)。

いくつかの関連リンク:あなたはR言語のRoughSetsパッケージを使用することができます

Weka's manual regarding attribute selection

A (somewhat outdated) hands-on example

0

。 RのFS.one.reduct.computationの説明を参照してください(RoughSetsパッケージのインストール後)

例:HIRING2Matrixは、属性数を持つ決定表です。 FS.one.reduct.computation(HIRING2Matrix、貪欲= TRUE、パワー= 1)

- reduct1属性

reduct1 <の縮小セットであります

関連する問題