outliers

0熱

1答えて

ELKIでkを変化させたLOFを実行して、どのkが最良かを簡単に比較できますか？通常、kを選択すると、たとえばROCAUCが表示されます。データセットに最適なkを取り出したいので、複数の実行を比較する必要があります。 kの値を手動で変更して実行するより簡単にやり直せますか？たとえば、すべてのk = [1-100]を比較したいと思います。おかげ

0熱

1答えて

If-Then-Elseステートメントで極端な異常値を処理する

極端な外れ値を使用して回帰モデルをオフにして、If-Then-Elseステートメントを使用してそれらを削除しました。しかし、SASはそれらのデータポイントを完全に削除し、残っているものに新たな異常値を発見しました。ミックスに多くを投じることなくアウトライヤーを分析から取り除く方法はありますか？ I計算Q3 + 1.5 * IQRとなるようにその値を使用：だから Data lungcancer; i

1熱

1答えて

Pythonで「スパイク」データのアウトライアー/ベストフィットを除去する

このようなデータを処理するのにはまったく新しいものです。私はどのように処理するのか分からない2つの曲線を持っていますが、結果としてどのようにしたいのか分かります。 2つのデータセットの元のプロットは以下のとおりです（左）。私がそれらのために持っていたいと思うラフフィットは、下に（右）重ねて表示され、赤色になります。最初の例：突然の振幅の低下は、データの取得方法のアーチファクトです。これは本質的

0熱

1答えて

最初の主成分はほとんどすべての情報を持っていますが、分類のための最良の指標ではないようです。

私は180要素の特徴ベクトルを持ち、その上にPCAを適用しました。問題は、最初のPCの分散が大きいことですが、pc1とpc2の両方のバイプロット図によれば、これは異常値のために起こっているようです。それは私にとって奇妙なことです。明らかに、最初のPCはここでの分類のための最良の指標ではありません。私はこのためにRを使用しています：ここもPC3対PC2ためのバイプロット図です。何が起こっている

0熱

1答えて

NAのデータフレームで異常値を除去する

私はいくつかのNAを持つデータフレームを持っています。異常値を見つけて中央値で置き換える必要がありますが、値が見つからない場合はすべての関数が機能しません。私はRを使用します。事前におかげ

2熱

1答えて

D3の軸の外れ値（数値とカテゴリの仕様を組み合わせる）

データポイントのコレクションの軸を持つD3で何かを設定しようとしています。しかし、データポイントの外れ値の場合、これらの外れ値を軸上のバケツに入れたいと思います。軸がそれらのデータポイントを配置するためのパーティションとして機能するための「異常値の目盛り」を指定できる方法はありますか？ Example: [1,3, 7, 12, 2048] * * * * * --

0熱

2答えて

DBSCANアルゴリズム外れ値

DBSCANアルゴリズムでは、外れ値はノイズとして破棄されることがありますが、アプリケーションによっては、これらのノイズの多いデータが、より定期的に発生するものよりも面白くなる可能性があります。どうして？

1熱

3答えて

特定の範囲の値を持つNAを外れ値に置き換えるには？

気候データがあり、外れ値をNAに置き換えようとしています。私は外れ値を計算するための値の範囲があるので、boxplot(x)$outを使用していません。 temp_range <- c(-15, 45) wind_range <- c(0, 15) humidity_range <- c(0, 100) 私のデータフレームは、（私は範囲に応じてNAに置き換えるべき値を強調した。）のでt

1熱

1答えて

RでX座標とY座標を持つグループ別にデータフレーム内の異常値を見つけるには？

私は外れ値を座標とグループでRで見つける必要があります。マイデータフレームは次のようになります。 22334444 22335544 11335552 しかし、私は自動でグループが異常値を得ることができませんでした： Name, Group, X, Y Bob, 2, -300, 20 Karl, 4, 200, 10 Sara, 2, -298, 19 Hans, 4, 210

-1熱

1答えて

大きなデータセットから異常値を検出して削除するにはどうすればよいですか？

私は手で次のデータセット（google drive link）を持っているとします。最も左の列は、カードの種類/クラス（クラブ、スペード、ダイヤモンド、ハート）を表します。残りの列はフィーチャー（Huモーメント）です。 4.00000000e+000 1.81685834e-001 9.69817396e-006 1.38999809e-003 4.53935830e-006 -3.009259