2017-08-23 6 views
2

私のpandasデータフレームには、各行がファイル名に対応する文字列である列があります。私は、JSONファイルから自分のデータを読み込み、このような列を抽出します。pandasデータフレームの行ベースの条件の削除

df = pd.read_json("mergedJSON.txt",lines=True,orient='columns') 
df2 = df.set_index("subject") 
for key,value in some_dict.iteritems(): 
    df2.loc[value,"file_name"].to_csv(outfile,index=False, header=False) 

私は、ファイルがディスク上で発見されたかどうかに基づいて、このデータフレームから特定の行をドロップする必要があります。これを行う方法がわかりません。ヘルプを感謝します。

答えて

1

ただ、最後の行

df2[df2.file_name.str.contains('stringValue')].loc[value,:].to_csv() 
0

まず、set_indexreindex をインデックスとしてファイル名を使用して、df.drop(filename)がそうであるように、これを使用しています。

関連する問題