2017-09-22 2 views
0

私は大きなデータフレームがありません。私は自動的に列を削除したいのです(列のキー/名前は動的なので、原則として列番号と名前はわかりません)に、行番号全体の特定のパーセンテージ未満の数の非ゼロ要素が含まれています。ゼロ以外の値のパーセンテージで列を選択

ありがとうございました!

+1

サンプルデータが役に立ちます – Dark

答えて

0

パンダには、パラメータを持つdropna関数があります。それを保持する必要のあるゼロ以外の値の数に設定するだけです。したがって

df.dropna(thres=int(len(df)*0.8), axis=1) 

行の80%未満が完全な列を削除します。

+0

ありがとうございました。これは、ゼロを0に変換する場合にのみ有効です。 df.replace(to_replace = 0、value = np.nan)、df.dropna(thres = int(len( df)* 0.8)、軸= 1) – user3620915

関連する問題