missing-data

    1

    1答えて

    申し訳ありませんが、これは明らかな答えがあるかもしれませんが、私は何のためにそれを行うのか不明です。 セイを例えば私は人の名前のリストを持っているデータセットを持って、彼らが作った販売数、そして、彼らはそれらの販売をした日付、次の形式ですべて:基本的に Name | Date | Sales ------------------------------------ AAA | 01/01/

    1

    1答えて

    数値以外の値を持つすべてのセルをデータなし(NA)に変換しようとしています。 recode_missing <- function (g, misval) { a <- g == misval temp = g temp [a] <- NA return (temp) } 素晴らしい作品:エレガントR液Iは次のように、不足しているデータに特定の値を変

    1

    1答えて

    私は100以上の列と50万行のデータセットを持っています。列Zの場合、一部の値が欠落しています。私は最初に2列(A,B)のデータをグループ化し、各グループについて中央値を取得します(それらの数値をスキップします)。次に対応するグループの中央値でZにナンを入力します。 私は df.groupby(["A","B"]).Z.median() でしたが、それはまた、グループの一部ではNaNを持ってい

    1

    1答えて

    imputeTSパッケージの関数を試しています。このパッケージは、単変量時系列データに欠損値を代入するためのいくつかの関数を提供します。私はそれらをテストし、それらはすべてna.kalman機能を除いて素晴らしいです。この関数は元の数値ベクトルを変更します。以下は例です。あなたが見ることができるように # Load packages library(imputeTS) # Set seeds

    0

    2答えて

    欠損値を含むデータフレームがあります。これらの欠損値は、複数の変数にまたがるが、前記変数において、一度に特定の観察結果に生じる。例えば、私のデータフレームのようなものになります。 r1 = c('', 'abc def', '') r2 = c('1', 'ghi jkl', '2') r3 = c('', 'mno pqr', '') df = as.data.frame(rbind(r1

    1

    1答えて

    私は不足しているデータを補う必要がある学校プロジェクトに取り組んでいます。マウスで代用した後、完成したデータセットを完全な関数で生成しようとしています。 1つずつ実行するとうまくいきますが、m = 5代用以上のものが必要な場合に備えてforループを使いたいと思います。 for-loopを実行しようとする今、私は常に完全に誤り エラーを取得(インピュテーションを[1]):入力データは、クラスの中音域

    2

    1答えて

    データセットに欠損値を代入しようとしています。私は欠損を補うために値を生成できる予測モデルを持っています。私がdfm [is.na(dfm)] < -imputeを使って代用すると、列方向に値が代入されます。しかし、私は行を賢明にする必要があるので、私はデータマトリックスを転置しました。私の質問は、マトリックスを転置せずにこれを行うエレガントな方法があるということですか?再現可能な例を示すrcod

    0

    1答えて

    各カウンタのユーザー名、カウンタおよびスコアを持つテーブルがあるとします。 data have; input user $ counter score; cards; A 1 50 A 3 30 A 6 90 B 1 20 B 4 20 ; run; いくつかのスコアは、一部のカウンタbeween不足している、とあなたは以前のカウンタと同じスコアを載せていきたいと思います。だ

    1

    1答えて

    私はアイトラッキングの研究を行っていますが、アイトラッカーが常に目を引くわけではありません。 1つのExcelファイルには〜30k-40k行があり、過去の利用可能なデータポイントと次に利用可能なデータポイントの平均を欠損値として入力したいと考えています。しかし、それを手動で行うには永遠にかかるでしょう。 テーブルの例を添付しました。したがって、X列の欠損値は、359.5または360に丸められる必要

    1

    1答えて

    2つのデータフレームがあるので、データフレーム辞書stocks['OPK']の1つのデータフレームと、単純なパンダデータフレームdfです。 これは、他のデータフレームと比べて面白いdfのスライスです(df.loc['2010-01-04':, 'Open'])。 Date Open 2010-01-04 1.80 2010-01-05 1.64 2010-01-06 1.90 2010