2017-07-31 22 views
2

から重複を削除します。しかし、後で私はこのDataFrameからのみ読むので、私はビューを使用したいと思います。警告を生成した行は、重複を削除する行だったので、ビューを生成しないと仮定します。は、私は、このようなコードを持っているデータフレームビュー

私の質問:ビューから重複を削除する方法はありますか?または、重複が含まれていないようにビューを絞り込む方法はありますか?

答えて

0

私はあなたがDataFrame.drop_duplicates内の一部のカラムだけでドロップ重複のパラメータのサブセットが必要だと思う:

raw_report.drop_duplicates(subset=[some_columns],inplace=True) 
+0

すごいああ、それは速かったです!私はこれをチェックさせてください:) – wvxvw

+0

まあ...正確ではありません。私がこれをした後、 'df._is_view'は' False'です。だから、私は 'drop_duplicates'は一般的にビューを作成しないだろうと推測しています。しかし、別の方法がありますか? 'groupby()'は何か類似しています。 – wvxvw

+0

Hmmm、私の解決策は元のdfの重複を削除します。だから、代わりに2ステップのソリューション私は1つのステップを作成します。しかし、dupesで元のものが必要で、別のdf(ビュー)が必要な場合は、コピーしないで、ハード設定しないで解決策が存在するかどうかは分かりません。 'pd.options.mode.chained_assignment = None' – jezrael

関連する問題