0
データフレーム内の範囲外のデータをNAで識別して置き換えるにはどうすればよいですか?データフレーム内の範囲外のデータをNAで識別して置き換えるにはどうすればよいですか?
現在、以下のコードを使用して、ボックスプロットを使用してアウトライヤーを特定し、次に範囲外のものを手動で決定します(たとえば、スケールは1〜4でデータポイントは負です)。
>boxplot(data$scale1, data = data)
>outliers <- boxplot(cw$N, plot=FALSE)$out
>outliers
>data$scale1[data$scale1==-7.58] <- NA
彼らすべてが範囲外であるために異なるカットオフポイントを持っているように私は手動で各変数のためにこれをやっているし、これを行うための簡単な方法がある場合、私は不思議でしたか?
おかげ
データには傾向がありますか?データポイントがいくつかの特定のトレンドに従っている場合は、トレンドに適合し、トレンドからあまり離れているデータポイントをアウトライヤーとみなすことができます。 – Heikki
カットオフをデータフレームに書き込んで、各変数に適用することができます。 @Heikki:私はこのアプローチが適切だろうシナリオは表示されません –
ありがとう! @tobiasegli_teは私の後ろのように聞こえる、私はちょうど各変数が別のカットオフポイントを持っている場合、それを行う方法について確信していた、あなたはアドバイスを持っていますか? – Shep