imputation

    2

    2答えて

    したがって、紛失したデータを補完するためにmiceパッケージを使用しています。私は帰属が初めてであるので、私は一点につきましたが、急な学習曲線に陥っています。おもちゃの例与えるために:あなたは、私はほとんどデフォルトの設定を使用して、DF1 10回帰属見ることができるように library(mice) # Using nhanes dataset as example df1 <- mice(

    2

    2答えて

    私は次の質問をしています:欠損値が文字列naによってマークされているpandasデータフレームがあります。私はそれにImputerを実行して、欠損値を列の平均値に置き換えたいとします。 sklearnのドキュメントによると、パラメータmissing_valuesはこれで私を助けてください。 missing_values : integer or “NaN”, optional (default=”

    0

    1答えて

    私は現在、ガウス混合モデルを使って欠けているデータを帰結しようとしています。 参考資料はこちらから: http://mlg.eng.cam.ac.uk/zoubin/papers/nips93.pdf 私は現在、2つのガウス成分を持つ二変量データセットに焦点を当てています。 > whichMissXY<-myData[ which(is.na(myData$waiting)),1:2] > wh

    0

    1答えて

    私はすべての欠損データ( '?'で示される)をNaNに代入しようとしており、sklearnの補間ツールを使って平均値に変換する。私の問題に再現性があることが、私は以下のように私のコードが含まれている:私はIDEはMac OS XとしてPyCharmを使用し、アナコンダのPy 2.7.12に これは私のコードです: import matplotlib.pyplot as plt import nu

    1

    2答えて

    N.A.値のこの単一のクラスを帰属/置換値で置き換えるだけの条件が他の列で満たされている場合、特定の列にN.A.値を記入したい。 など。私は実行したい: パンダでこれを達成するにはどうすればいいですか? dataframe[dataframe['firstColumn'] == 'value1'].fillna({'column2':'replacementValue'}でこれを行おうとすると、レ

    1

    1答えて

    複数の帰属データセットの平均予測誤差のブートストラップ推定を準備しています。私の関数は、スコープ内の従属変数を見つけることができないようです。それを回避する方法はありますか? 多重代入がスムーズに実行されますが、特定の問題は、ライン mod.nb.train <- with(data = data.mi.train, exp = glm.nb(f)) が変数CG.totを見つけることができない

    0

    1答えて

    scikit-learnでImputer()を使用して、その月の平均値で不足している温度値を入力する必要があります。 まず、月に基づいてデータフレームをグループに分割しました。次に、そのグループの平均を計算し、欠損値を記入するために関数関数を呼び出しました。ここで は、私が書いたコードですが、それはうまくいきませんでした: def impute_missing (data_1_group):

    4

    2答えて

    Pythonで欠損値を代入しようとしていますが、sklearnは平均(平均、中央値、またはモード)補完以外の方法を持っていません。 Orange imputation modelは実行可能なオプションを提供するようです。しかし、Orange.data.Tableがnp.nanを認識していないか、何らかの理由で補完が失敗しているようです。 import Orange import numpy as

    5

    1答えて

    私はこのようになりますいくつかの欠落したデータになるデータセットがあります。 id category value 1 A NaN 2 B NaN 3 A 10.5 4 C NaN 5 A 2.0 6 B 1.0 が、私はモデルのデータを使用してヌルを記入する必要があります。最初にカテゴリが発生するたびに、NULLになります。私がやりたいの方法は