コードを投稿していないので、一般的な方法でしか回答できません。
- CSVは以下のようにpandas.DataFrame.drop_duplicatesを使用して別々のDF1で出現> 1のすべての値pandas.read_csv
保存]を使用してpd.Dataframeにファイルをロード:
DF1 = df.drop_duplicatesは、(「=保ちます最初)
- >これは、重複した値の最初の出現と行を含むデータフレームを戻します例:値1000は最初の行のみをbであろう5行にある場合。 eが返され、他はドロップされます。
- > df1.shape [0]を適用すると、dfの重複値の数が返されます。
あなたは別々のCSVに「重複する値」を含むDFのすべての行をファイル保存したい3.Ifはあなたがこのようになめらかをしなければならない。
df=pd.DataFrame({"A":[0,1,2,3,0,1,2,5,5]}) # This should represent your original data set
print(df)
df1=df.drop_duplicates(subset="A",keep="first") #I assume the column with the duplicate values is columns "A" if you want to check the whole row just omit the subset keyword.
print(df1)
list=[]
for m in df1["A"]:
mask=(df==m)
list.append(df[mask].dropna())
for dfx in range(len(list)):
name="file{0}".format(dfx)
list[dfx].to_csv(r"YOUR PATH\{0}".format(name))
こんにちは、StackOverflowのへの歓迎。効果的な質問を書く方法を学ぶには[こちらをご覧ください](http://stackoverflow.com/help/how-to-ask)、方法については[こちら](http://stackoverflow.com/help/mcve)をご覧ください最小限で、完全で、検証可能な例を作成します。 – cmaher