missing-data

1熱

1答えて

申し訳ありませんが、これは明らかな答えがあるかもしれませんが、私は何のためにそれを行うのか不明です。セイを例えば私は人の名前のリストを持っているデータセットを持って、彼らが作った販売数、そして、彼らはそれらの販売をした日付、次の形式ですべて：基本的に Name | Date | Sales ------------------------------------ AAA | 01/01/

1熱

1答えて

データフレーム内の非数値セルをすべてNAに変換する方法

数値以外の値を持つすべてのセルをデータなし（NA）に変換しようとしています。 recode_missing <- function (g, misval) { a <- g == misval temp = g temp [a] <- NA return (temp) } 素晴らしい作品：エレガントR液Iは次のように、不足しているデータに特定の値を変

1熱

1答えて

パンダは与えられたグループの中央値で欠損値を記入します

私は100以上の列と50万行のデータセットを持っています。列Zの場合、一部の値が欠落しています。私は最初に2列(A,B)のデータをグループ化し、各グループについて中央値を取得します（それらの数値をスキップします）。次に対応するグループの中央値でZにナンを入力します。私は df.groupby(["A","B"]).Z.median() でしたが、それはまた、グループの一部ではNaNを持ってい

1熱

1答えて

R imputeTSパッケージからのna.kalman関数の奇妙な振る舞い

imputeTSパッケージの関数を試しています。このパッケージは、単変量時系列データに欠損値を代入するためのいくつかの関数を提供します。私はそれらをテストし、それらはすべてna.kalman機能を除いて素晴らしいです。この関数は元の数値ベクトルを変更します。以下は例です。あなたが見ることができるように # Load packages library(imputeTS) # Set seeds

0熱

2答えて

条件付きで文字列のサブセットに従って欠損値を入力します

欠損値を含むデータフレームがあります。これらの欠損値は、複数の変数にまたがるが、前記変数において、一度に特定の観察結果に生じる。例えば、私のデータフレームのようなものになります。 r1 = c('', 'abc def', '') r2 = c('1', 'ghi jkl', '2') r3 = c('', 'mno pqr', '') df = as.data.frame(rbind(r1

1熱

1答えて

入力データにはクラスmidsが必要です

私は不足しているデータを補う必要がある学校プロジェクトに取り組んでいます。マウスで代用した後、完成したデータセットを完全な関数で生成しようとしています。 1つずつ実行するとうまくいきますが、m = 5代用以上のものが必要な場合に備えてforループを使いたいと思います。 for-loopを実行しようとする今、私は常に完全に誤りエラーを取得（インピュテーションを[1]）：入力データは、クラスの中音域

2熱

1答えて

欠けている値をベクトルで置き換えます。

データセットに欠損値を代入しようとしています。私は欠損を補うために値を生成できる予測モデルを持っています。私がdfm [is.na（dfm）] < -imputeを使って代用すると、列方向に値が代入されます。しかし、私は行を賢明にする必要があるので、私はデータマトリックスを転置しました。私の質問は、マトリックスを転置せずにこれを行うエレガントな方法があるということですか？再現可能な例を示すrcod

0熱

1答えて

前/後の方法で前の行から欠落している行を作成する

各カウンタのユーザー名、カウンタおよびスコアを持つテーブルがあるとします。 data have; input user $ counter score; cards; A 1 50 A 3 30 A 6 90 B 1 20 B 4 20 ; run; いくつかのスコアは、一部のカウンタbeween不足している、とあなたは以前のカウンタと同じスコアを載せていきたいと思います。だ

1熱

1答えて

前回と次の利用可能なデータに基づいて、欠損値を自動的に計算して補充します。

私はアイトラッキングの研究を行っていますが、アイトラッカーが常に目を引くわけではありません。 1つのExcelファイルには〜30k-40k行があり、過去の利用可能なデータポイントと次に利用可能なデータポイントの平均を欠損値として入力したいと考えています。しかし、それを手動で行うには永遠にかかるでしょう。テーブルの例を添付しました。したがって、X列の欠損値は、359.5または360に丸められる必要

1熱

1答えて

2つの同様のデータフレームを比較し、1つのデータフレームの欠損値を埋めてください

2つのデータフレームがあるので、データフレーム辞書stocks['OPK']の1つのデータフレームと、単純なパンダデータフレームdfです。これは、他のデータフレームと比べて面白いdfのスライスです（df.loc['2010-01-04':, 'Open']）。 Date Open 2010-01-04 1.80 2010-01-05 1.64 2010-01-06 1.90 2010