私はメッセージショップのposデータを持っています。 データは添付の画像のとおりです。 posデータ用のPythonのfor-loopでのデータクリーニング
##read data from csv
data = pd.read_csv('test1.csv')
#make a kist for each column
sales_id = list(data['sales_id'])
shop_number = list(data['shop_number'])
sales = list(data['sales'])
cashier_no = list(data['cashier_no'])
messager_no = list(data['messager_no'])
type_of_sale = list(data['type_of_sale'])
costomer_ID = list(data['costomer_ID'])
type_of_sale = list(data['type_of_sale'])
date = list(data['date'])
time = list(data['time'])
私は購入のデータが削除されるべきであることを示す新しいリストを作りたいです。このような :それを行うには
data_to_clean= [0,1,0,1,0,0,1,0,1]
私はこのコードでは二つの主要な問題があり、ループ
for i in range(len(type_of_sale)):
data_to_clean=[]
if type_of_sale[i] == "purchase":
data_to_clean = data_to_clean.append(0)
elif type_of_sale[i] == "return":
data_to_clean = data_to_clean.append(1)
## I want to write a code so I can delete purchasse data too
#with conditions if it has the same shop_number,messager_no,costomer_ID and -price
return list(data_to_clean)
のために作りたいです。 1つは動かない。 2番目私はshop_number
、messager_no
とcostomer_ID
を確認する方法がわからない私のdata_to_clean
のリストに1または0を入れる。 時々私はsales_id(1628060)
のような上記のデータをチェックしなければならない場合があります。sales_id(1599414)
キャッシャーが異なるかもしれません。 しかし、constomer_Idは常に同じでなければなりません。
質問は、どのデータを削除する必要があるかを示す0と1のリストまたはデータフレームを作成できるように、コードを書き込む方法です。
何 'データ= pd.read_csv(「test1.csv」)'戻りますか? –
'list.append()'は 'None'を返しますので、' data_to_clean = data_to_clean.append(0) 'は期待どおりに動作しません。 –
dataはpythonの中でデータを入力するためのパンダのデータフレームです。 – Tateishi