imputation

    -1

    1答えて

    x属性とyレコードを持つデータセットがあります。最大x-1個の欠損値を持つ入力レコードがある場合、残りの欠損値のどれを合理的に近似することができますか? そこで、以下の例では、入力レコードは(残りは行方不明と、属性2及び6)2つの値を有し、I属性8 Iの値に近似したいです欠損値は「代用」によって処理されていることを知っていますが、私は一般に前処理データセットに関する例を見つけています。私は回帰を使

    1

    1答えて

    私は不足しているデータを補う必要がある学校プロジェクトに取り組んでいます。マウスで代用した後、完成したデータセットを完全な関数で生成しようとしています。 1つずつ実行するとうまくいきますが、m = 5代用以上のものが必要な場合に備えてforループを使いたいと思います。 for-loopを実行しようとする今、私は常に完全に誤り エラーを取得(インピュテーションを[1]):入力データは、クラスの中音域

    0

    1答えて

    フィーチャの平均値を代入したいが、別のカラムに同じカテゴリ/名目値を持つ他の例に基づいて平均値を計算したいscikit-learnのImputerクラスを使ってこれが可能かどうか疑問に思っていますか?そのようにパイプラインに追加するほうが簡単になります。例えば :kaggleからタイタニックデータセットを使用して :source にはどうすれば平均pclassあたりfareを帰に行きますか。その背

    0

    2答えて

    欠落値または帰属値をプロットする際に問題があります。私はこのコードを実行しようとすると:助けてください Error in as.matrix.data.frame(X) : dims [product 284088] do not match the length of object [284121] :私は次のエラーを取得する mice_plot <- aggr(demo, col=c('

    0

    2答えて

    Hmisc代償モデルでデータフレームを代入しようとしています。一度に1つの列のデータを代入することはできますが、列をループすることはできません。例以下は - 正常に動作しますが、私は、関数を使用して、それを動的にしたいと思います:私は、関数を実行するエラーはありませんが、ノーあり impute_dataframe <- function() { for(i in 1:ncol(impu

    3

    4答えて

    私はRが新しく、問題に苦しんでいます。 与えられたサイズのウィンドウ内の要素の平均値に従って、ベクトルの欠損値を代入する関数が必要です。 私のNAが30位にあり、ウィンドウサイズが10であるため、平均値はx[20:40]と計算されるため、このウィンドウが移動します。したがって、それぞれがNAであると、ウィンドウ平均は異なり​​ます。 impute.to.window.mean <- functio

    3

    1答えて

    私は時系列データセットに欠損値があります。欠落している値を代入したいと思いますが、imputeTSパッケージの線形、スプラインまたはスティンなど、どの方法が最も適切かはわかりません。 私のデータがMCAR、MAR、NMARであるかどうかをテストしたいと思います。私はMCARだと思っていますが、テストをするのに興味があります。 str(wideRawDF) 'data.frame': 1343 o

    0

    1答えて

    私は半疎である行列を持っています。すべての細胞の半分が空白(na)なので、私が 'マウス'を走らせようとするとき、それらはすべてマウスで動こうとします。私はサブセットに興味があります。 質問:次のコードでは、「マウス」を最初の2つの列でのみ動作させる方法を教えてください。以前の行の内容が現在の行のパッチホールに役立つように、行遅延または行頭を使用してこれを行うためのきれいな方法がありますか?私は答

    0

    1答えて

    多数の列を持つデータセットがあります。欠落していると、それはimputer戦略としてmeanを持つimputer値で満たされます。 しかし、列全体の値がすべて不足していると、コンピュータがどのように機能するのか、そのような場合には正しい方法は何でしょうか。

    1

    2答えて

    Customer id Year a b 1 2000 10 2 1 2001 5 3 1 2002 NA 4 1 2003 NA 5 2 2000 2 NA 2 2001 NA 4 2 2002 4 NA 2 2003 8 10 3 2000 9 NA 3 2001 10