2017-02-22 10 views
0

uciからダウンロードしたシャトルというデータセットにローカル外れ値を実行しています。毎回私は決定クラスの有無にかかわらずシャトルデータセットでアルゴリズムを実行しますが、elkiは異なる出力グラフを描画しています。私は毎回異なる出力グラフを描く理由は何か混乱していますか?出力グラフのLOF変更

答えて

0

ビジュアライゼーションでは、バティックのレンダリングツリーをメモリに入れるだけでなく、複雑なXMLドキュメント(正確にはSVG)を必要とするApache Batikを使用します。

これは、可視化は非常にスケーラブルではないになり、パラメータ10000のサンプルにデフォルト

-vis.sampling 

があります。したがって、大きなデータセットでは、が視覚化されたのサンプルが毎回表示されます。もちろん、分析のためにすべてのデータを使用します。ランダムシードを修正するためのパラメータを追加することはかなり容易であろうが、人々は、このサイトを参照してください、外れ値検出のためのより適切な設定シャトルデータのバリエーションについては

...あまりにも多くのパラメータに文句を言う傾向がある:

http://www.dbs.ifi.lmu.de/research/outlier-evaluation/DAMI/literature/Shuttle/

正しくファイルを読み込むための注意idカラムを分析に使用されていない、と外れ値のラベル列のみ評価のためのクラスとして使用されるように、あなたはパラメータ-arff.externalid id -arff.classlabel outlierが必要になります。

+0

あなたの返信はThx broです。 50000データポイントの出力グラフを作成するには時間がかかり過ぎるので、私はただのテキストファイルでLOFの出力を見たいので、もう一つ問題があります。エルキでも可能ですか? –

+0

はい、ビジュアライザーの代わりに結果ライターを選択してください。 –