imputation

2熱

2答えて

したがって、紛失したデータを補完するためにmiceパッケージを使用しています。私は帰属が初めてであるので、私は一点につきましたが、急な学習曲線に陥っています。おもちゃの例与えるために：あなたは、私はほとんどデフォルトの設定を使用して、DF1 10回帰属見ることができるように library(mice) # Using nhanes dataset as example df1 <- mice(

2熱

2答えて

Python - SkLearn Imputer usage

私は次の質問をしています：欠損値が文字列naによってマークされているpandasデータフレームがあります。私はそれにImputerを実行して、欠損値を列の平均値に置き換えたいとします。 sklearnのドキュメントによると、パラメータmissing_valuesはこれで私を助けてください。 missing_values : integer or “NaN”, optional (default=”

0熱

1答えて

不足しているデータを補間するガウス混合モデルの潜在変数

私は現在、ガウス混合モデルを使って欠けているデータを帰結しようとしています。参考資料はこちらから： http://mlg.eng.cam.ac.uk/zoubin/papers/nips93.pdf 私は現在、2つのガウス成分を持つ二変量データセットに焦点を当てています。 > whichMissXY<-myData[ which(is.na(myData$waiting)),1:2] > wh

0熱

1答えて

機械学習データを代入している間に疑問符（ '？'）をNaNに変換するエラー

私はすべての欠損データ（ '？'で示される）をNaNに代入しようとしており、sklearnの補間ツールを使って平均値に変換する。私の問題に再現性があることが、私は以下のように私のコードが含まれている：私はIDEはMac OS XとしてPyCharmを使用し、アナコンダのPy 2.7.12にこれは私のコードです： import matplotlib.pyplot as plt import nu

1熱

2答えて

特定の列についてN.A.を記入する

N.A.値のこの単一のクラスを帰属/置換値で置き換えるだけの条件が他の列で満たされている場合、特定の列にN.A.値を記入したい。など。私は実行したい：パンダでこれを達成するにはどうすればいいですか？ dataframe[dataframe['firstColumn'] == 'value1'].fillna({'column2':'replacementValue'}でこれを行おうとすると、レ

1熱

1答えて

with-statement内で関数を呼び出すと、関数スコープにエラー変数がありません。

複数の帰属データセットの平均予測誤差のブートストラップ推定を準備しています。私の関数は、スコープ内の従属変数を見つけることができないようです。それを回避する方法はありますか？多重代入がスムーズに実行されますが、特定の問題は、ライン mod.nb.train <- with(data = data.mi.train, exp = glm.nb(f)) が変数CG.totを見つけることができない

0熱

1答えて

scikit-learnでImputerを使用

scikit-learnでImputer()を使用して、その月の平均値で不足している温度値を入力する必要があります。まず、月に基づいてデータフレームをグループに分割しました。次に、そのグループの平均を計算し、欠損値を記入するために関数関数を呼び出しました。ここでは、私が書いたコードですが、それはうまくいきませんでした： def impute_missing (data_1_group):

4熱

2答えて

予測モデルを使用して欠損値を代入する

Pythonで欠損値を代入しようとしていますが、sklearnは平均（平均、中央値、またはモード）補完以外の方法を持っていません。 Orange imputation modelは実行可能なオプションを提供するようです。しかし、Orange.data.Tableがnp.nanを認識していないか、何らかの理由で補完が失敗しているようです。 import Orange import numpy as

5熱

1答えて

パンダ：GROUPBYの平均でnull値を埋めるためにどのように？

私はこのようになりますいくつかの欠落したデータになるデータセットがあります。 id category value 1 A NaN 2 B NaN 3 A 10.5 4 C NaN 5 A 2.0 6 B 1.0 が、私はモデルのデータを使用してヌルを記入する必要があります。最初にカテゴリが発生するたびに、NULLになります。私がやりたいの方法は