imputation

-2熱

1答えて

私は形のデータフレームを持っています2701x128これは欠けている値がたくさんあります。いくつかの行には95％のデータと5％のデータしかないことがあります。私はそれを視覚化してみましょう： X軸は（ソート後の）行の数であり、y軸は非ゼロ値（SORTED、ヒストグラムのような） Xの数であります私がする必要がある：すべての行（SORTED、ヒストグラムのような）私は必要の上に持っているどのように

0熱

1答えて

マウスRパッケージを使用した多重代入後のクラスターロバスト標準エラー

midsクラスオブジェクトを使用してクラスターロバスト標準エラーを計算したいと思います。これは、元のデータの列に欠損値が複数代入されることによって発生します。下の最小の例。 library(mice) y <- c(1,0,0,1,1,1,1,0) x <- c(26, 34, 55, 15, 31 ,47, 97, 12) z <- c(2, NA, 0, NA, 3 ,7,7, 5)

0熱

3答えて

NAをデータセット内の別の場所の同等の値に置き換えるにはどうすればよいですか？

私は同様の質問を探してみましたが、見つけられませんでした。もしあなたが私に教えてください！ nutrient.component. grain nutrients 1 Beta-carotene (μg) White Rice 0.00 2 Beta-carotene (μg) Brown Rice NA 3 Calcium (mg) White Rice

0熱

1答えて

scikit-learnでカテゴリデータ型の列を代入する方法

フィーチャに数値とオブジェクトの両方を含むデータセットがあります。さらに、オブジェクトデータ型のフィーチャの一部に値がありません。数値型とカテゴリ型の両方の欠損値を処理するために、Imputerの変更バージョン（別のポストの指示に従って）を作成しましたが、データセットに適用するとAttributeErrorが返されます。私は、偽りのためのフィット方法の定義に愚かな間違いをしていると信じています。私

1熱

1答えて

R's Time-Seriesは自動的に欠損データを生成しますか？

統計パッケージのRの時系列に関する知識を持っている人なら誰でも助けてくれるのだろうかと思っていました。私は現在、statのts関数を使用して時系列を生成しています。私は、データセット（3年間の日付と1日の数値）、開始日と終了日を小数点として解析し、頻度は365です。ただし、欠落している日付の範囲があります（たとえば、2016年4月30日から2017年1月2日までの日付と値がありません）。し

0熱

1答えて

複数の転用練習

私はRの複数の転用方法を検討していますが、私は根本的に重要な質問に出くわしました。以下のスクリプトでは、数字はどのような目的のためにデータ[4:10、3] < - rep（NA、7）で表示されますか？ RにNAを7回繰り返すように指示していますか？ library(mice) library(Amelia) library(mi) library(missForest) library(H

0熱

1答えて

Python Pandas Null値の代入

df [row、 'avg']行の平均と列の平均（ 'impute [col]'）に対応するオフセットでヌル値を代入しようとしています。メソッドを.mapと並列化する方法はありますか？または、ヌル値を含むインデックスを反復処理するより良い方法がありますか？ test = pd.DataFrame({'a':[None,2,3,1], 'b':[2,np.nan,4,2], 'c'

0熱

1答えて

マウスでdata.frameのすべての列に値を代入する

マウスを使用して線形モデルを使用して値を代入しようとしています。マウスの私の理解は、それが行を繰り返すことです。 NAsを持つ列の場合、他のすべての列を予測変数として使用し、モデルに適合させてから、このモデルのサンプルを使用してNAsを埋めます。ここでは、いくつかのデータを生成し、切り抜きを使用して欠落したデータを導入する例を示します。 n <- 100 xx<-data.frame(

1熱

1答えて

"missforest" in R

"missforest"パッケージを使用してRでデータ代入を実行する際に、以下のエラーを回避するのに役立つ必要があります。 > imputed<- missForest(dummy, maxiter = 10, ntree = 100, variablewise = TRUE, + decreasing = TRUE, verbose = TRUE, + mtry = fl

0熱

1答えて

複数の代用後に適合値を抽出する方法

busan<-subset(influ_busan, select = c(CNT,temp_min,temp_diff,humid_mean,hpa_mean,rad_mean,wind_mean,o3)) new_busan<-mice(busan, seed=12345, n=5) lm_busan <- with(new_busan,lm(CNT~temp_min+temp_dif