outliers

    0

    1答えて

    ELKIでkを変化させたLOFを実行して、どのkが最良かを簡単に比較できますか? 通常、kを選択すると、たとえばROCAUCが表示されます。データセットに最適なkを取り出したいので、複数の実行を比較する必要があります。 kの値を手動で変更して実行するより簡単にやり直せますか?たとえば、すべてのk = [1-100]を比較したいと思います。 おかげ

    0

    1答えて

    極端な外れ値を使用して回帰モデルをオフにして、If-Then-Elseステートメントを使用してそれらを削除しました。しかし、SASはそれらのデータポイントを完全に削除し、残っているものに新たな異常値を発見しました。ミックスに多くを投じることなくアウトライヤーを分析から取り除く方法はありますか? I計算Q3 + 1.5 * IQRとなるようにその値を使用:だから Data lungcancer; i

    1

    1答えて

    このようなデータを処理するのにはまったく新しいものです。私はどのように処理するのか分からない2つの曲線を持っていますが、結果としてどのようにしたいのか分かります。 2つのデータセットの元のプロットは以下のとおりです(左)。私がそれらのために持っていたいと思うラフフィットは、下に(右)重ねて表示され、赤色になります。 最初の例: 突然の振幅の低下は、データの取得方法のアーチファクトです。これは本質的

    0

    1答えて

    私は180要素の特徴ベクトルを持ち、その上にPCAを適用しました。問題は、最初のPCの分散が大きいことですが、pc1とpc2の両方のバイプロット図によれば、これは異常値のために起こっているようです。それは私にとって奇妙なことです。 明らかに、最初のPCはここでの分類のための最良の指標ではありません。私はこのためにRを使用しています :ここ もPC3対PC2ためのバイプロット図です。何が起こっている

    0

    1答えて

    私はいくつかのNAを持つデータフレームを持っています。異常値を見つけて中央値で置き換える必要がありますが、値が見つからない場合はすべての関数が機能しません。私はRを使用します。事前に おかげ

    2

    1答えて

    データポイントのコレクションの軸を持つD3で何かを設定しようとしています。しかし、データポイントの外れ値の場合、これらの外れ値を軸上のバケツに入れたいと思います。軸がそれらのデータポイントを配置するためのパーティションとして機能するための「異常値の目盛り」を指定できる方法はありますか? Example: [1,3, 7, 12, 2048] * * * * * --

    0

    2答えて

    DBSCANアルゴリズムでは、外れ値はノイズとして破棄されることがありますが、アプリケーションによっては、これらのノイズの多いデータが、より定期的に発生するものよりも面白くなる可能性があります。どうして ?

    1

    3答えて

    気候データがあり、外れ値をNAに置き換えようとしています。 私は外れ値を計算するための値の範囲があるので、boxplot(x)$outを使用していません。 temp_range <- c(-15, 45) wind_range <- c(0, 15) humidity_range <- c(0, 100) 私のデータフレームは、(私は範囲に応じてNAに置き換えるべき値を強調した。) のでt

    1

    1答えて

    私は外れ値を座標とグループでRで見つける必要があります。 マイデータフレームは次のようになります。 22334444 22335544 11335552 しかし、私は自動でグループが異常値を得ることができませんでした: Name, Group, X, Y Bob, 2, -300, 20 Karl, 4, 200, 10 Sara, 2, -298, 19 Hans, 4, 210

    -1

    1答えて

    私は手で次のデータセット(google drive link)を持っているとします。 最も左の列は、カードの種類/クラス(クラブ、スペード、ダイヤモンド、ハート)を表します。残りの列はフィーチャー(Huモーメント)です。 4.00000000e+000 1.81685834e-001 9.69817396e-006 1.38999809e-003 4.53935830e-006 -3.009259