私は大きなデータフレームがありません。私は自動的に列を削除したいのです(列のキー/名前は動的なので、原則として列番号と名前はわかりません)に、行番号全体の特定のパーセンテージ未満の数の非ゼロ要素が含まれています。ゼロ以外の値のパーセンテージで列を選択
ありがとうございました!
私は大きなデータフレームがありません。私は自動的に列を削除したいのです(列のキー/名前は動的なので、原則として列番号と名前はわかりません)に、行番号全体の特定のパーセンテージ未満の数の非ゼロ要素が含まれています。ゼロ以外の値のパーセンテージで列を選択
ありがとうございました!
パンダには、パラメータを持つdropna
関数があります。それを保持する必要のあるゼロ以外の値の数に設定するだけです。したがって
df.dropna(thres=int(len(df)*0.8), axis=1)
行の80%未満が完全な列を削除します。
ありがとうございました。これは、ゼロを0に変換する場合にのみ有効です。 df.replace(to_replace = 0、value = np.nan)、df.dropna(thres = int(len( df)* 0.8)、軸= 1) – user3620915
サンプルデータが役に立ちます – Dark