outliers

    1

    1答えて

    私は線形回帰から得られた結果を再現することになっていました(1360の観測値と52の変数を持つ時系列データ(回帰モデルの11変数) )。元の研究では、研究者はHadi法で外れ値を特定した。これはmvBacon関数を使ってRで一番うまくいくようですが、これは正しいですか?私はこれを使用する方法についての良い答えを見つけることができないようだ誰も私が異常値を見つけるためにこの関数を使用することができま

    0

    1答えて

    DBSCANを使用してデータセットでクラスタリングを実行しています。私はそれが単一の値ではないplt.plot()のmarkerfacecolorに渡されるカラー引数のためだと思います。ここで間違っている場合はお知らせください。私の特徴は、緯度、経度、speed_mph、speedlimit_mph、vehicle_id、driver_idです。ここで は私のクラスタリングコードはここ dbsc

    0

    1答えて

    私はRに非常に慣れており、GLMを改善するために、アウトライアをサブセットから削除しようとしています。私が使用していたコードは次のとおりです。 data$sel <- ifelse(data$chol==8.3 & data$whr==1.14 ,(0), (1)) data dim(data) data2 <- subset(data, !(chol==8.3 & whr==1.14))

    0

    1答えて

    私はすべての被験者(合計20個)と条件ごとの反応時間(合計3個)を持つdata.frameを持っています。例えば以下を参照してください。 Iは、各被験者 私は、このコード使用するために、各条件の平均値から外れ値を削除したいと思います: dat<- do.call(rbind,by(dat,dat$condition,function(x) x[!abs(scale(x$rt_raw)) > 2,]

    0

    1答えて

    高速フーリエ変換信号用のDataFrameがあります。 周波数はHzで1列あり、対応する振幅で1列あります。 私は2,3年前に書かれたポストを読みました。単純なブール関数を使用して、いくつかの標準偏差よりも上または下の最終データフレーム内のアウトライアを除外することができます。 df = pd.DataFrame({'Data':np.random.normal(size=200)}) # exa

    -2

    2答えて

    Breunig & Sanderの公表に従って、ローカル外れ値係数(LOF)の正しい計算式を得たいです。 Iこの式を発見した:疑われる外れ値のLRDを介して分割 LOF =(MinPts領域に位置するオブジェクトのLRDの平均)、これはMinPtsの重心です。 これが正しい場合、私は疑いがあります。 、疑いのある外れ値のLRDを介して分割 LOF =(疑わすなわち重心のLRDを含むMinPts領域

    0

    1答えて

    私はクラスタリングによってデータの異常値を見つけたいと思っています。私はクラスタリングの後に、最も遠いサンプルを異常値とみなします。私のデータにはクラスが1つしかないことがわかります。このようにクラスタリングすると、異常値を見つけることができます。また、データにクラスが1つしかないときに異常値を見つける方法はありますか?

    2

    1答えて

    時系列データの外れ値検出に取り組んでいます。 Chen and Liu's time seriesアウトライア検出を実装している[tsoutliers][1]パッケージが見つかりました。しかし、私はRに install.packages("tsoutliers") tsoutliersをインストールすることができません私は、次の依存関係のエラーに In file included from KF-

    1

    1答えて

    "この"プロバイダとデータベースの "すべて"プロバイダ間のメトリックを比較するために、d3plusでウィスカを使用してボックスプロットを作成しようとしています。私はすでに処理前の段階で非常に大きな配列から5統計の要約を計算しており、これらを変数dataに渡しています。添付されたスニペット(d3plus website exampleから変更)を実行すると、コードとプロットがどのように見えるかを確