2017-07-01 4 views
2

データセットをクリーンアップしようとしていますが、基本的に空の値が100以上の空の値を持つすべてのフィーチャを削除します。 pandas/python。私は私を取得する次のコマンド空の値(python/pandas)を含むフィーチャのリストを取得

train.isnull().sum()>=100 

を使用しています:私は機能3と4

せずに新しいデータフレームを返したい

Id False 
Feature 1 False 
Feature 2 False 
Feature 3 True 
Feature 4 False 
Feature 5 True 

ありがとうございました。あなたのケースで

+0

データセットの再現可能な例を提供してください。 – www

答えて

1

、単に実行します。

train[train.columns[train.isnull().sum()<100]] 

を全例:

import pandas as pd 
df = pd.DataFrame([[1,None,2],[3,4,None],[7,8,9]], columns = ['A','B','C']) 

あなたが得られます。

A B  C 
0 1 NaN 2.0 
1 3 4.0 NaN 
2 7 8.0 9.0 

は、実行されている:

A 0 
B 1 
C 1 

そしてちょうど希望列を選択:

df.columns[df.isnull().sum()<100] 

をして、データフレームをフィルタリング:

df.isnull().sum() 

がnullのカウントになります

df[ df.columns[df.isnull().sum()<100]] 
+1

確かに、それは非常にうまくいく、ありがとう! – Liky

+0

素晴らしい!あなたの問題を解決するなら、upvotingを検討し、答えを正しいとマークしてください:) – Dimgold

+0

私は正しい答えをマークしました!私も答えをアップアップしましたが、これまであまりにも初心者(15評判未満)が表示されていました。 – Liky

関連する問題