missing-data

    0

    2答えて

    R(Framingham Heart Studyのデータ)にデータセットがあり、BMIグループを " 「正常」、「太り過ぎ」、および「肥満」を含む。 これは11,000以上の観測値と38個の変数/列を持ちますので、ここにデータの一部を投稿するのは難しいでしょう(これがなければ、それほど大きな問題にならないといいですね)。 データセットがFRMと呼ばれ、私は次のようにサブセットしようとしています:「

    0

    2答えて

    MSPからラズベリーパイ3から2 Xbee S1モジュールにいくつかのパッケージを送信しようとしています。 Xbeeは、DigiMesh 2.4としてエスケープされたフレーム、ルータと他のコーディネータとして1つのフレームで構成されています。ラズベリーでは、USBドングルで接続します。 私のコードは、MSPで、CTSフロー制御で10ユーロごとにパッケージを送信します。コーディネーターがPCを走らせ

    -1

    1答えて

    私は特に欠損値を扱うデータを前処理しようとしています。 私は単語のリストとテキストデータを持つ2つの列を持っています。リストから単語を2つのテキスト列の少なくとも一つである場合、私は言葉 import pandas as pd a=['coffee', 'milk', 'sugar'] test=pd.DataFrame({'col':['missing', 'missing', 'missi

    0

    1答えて

    "factor"型の列と "numeric"型のデータフレームがあります。いずれの「因子」列にも欠損値はありません。 私は次のコードを使用して、列の中央値で各列の欠損値を置き換えるためにしようとしています:私はエラーを取得していますが for(i in 1:ncol(df3)){ df3[is.na(df3[,i]), i] <- median(df3[,i], na.rm = TRUE

    0

    1答えて

    私は臨床試験の仕事をしています。私はLabDataというデータフレームを持っています。各被験者について、8回の実験室試験が実施されていたはずである。私はテスト名のベクトルを持っています。私は、各科目について、どのテストが欠けているかを教えてくれる新しいデータフレームを出力しようとしています。私はいくつかのdplyrとブラケット表記法を使用しましたが、これまでの主題を反復する方法と、すべてをクリーン

    -1

    1答えて

    "#NA ####"を含むデータフレームがあります。グループを意味する。 を私が最初にnp.NANと "#NA ####" を置き換えることができ、その後、pd.fillnaを使用していますが、任意のより便利な方法があります知っていますか?

    1

    1答えて

    データが欠落している特別なケースを表すために、netcdfファイルの4および8バイト浮動小数点変数に「塗りつぶし」値を設計したいと考えています。すでに定数NF_FILL_FLOATがあり、その設計についての私の理解は、大きくて奇妙な値であることに加えて、非常に圧縮可能なビットパターンを持つということです。私はそれが巨大(x)とは違うと信じています。私はすでに欠損値を埋めるためにNF_FILL_FL

    -1

    1答えて

    欠落しているデータをcsvから作成したデータフレームがありますか?シンボル。どのくらいの行があるかをチェックしたいですか?発生回数とともに発生する。 これまでのところ、私はこれを作ったが、それはすべての行の数を示しているだけでなく、発生する。 print(sum([True for idx,row in df.iterrows() if any(row.str.contains('[?]'))]