2016-11-01 12 views
0

私はPythonを使用してpostgreSQLにCSVデータをインポートしています。 CSVファイルに重複しているようです。私はCSVファイルに5つの列を持ち、そのうちの1つはユーザー名です。 Pythonに、私のファイルに同じユーザ名を持つ重複を表示するように指示する方法を教えてください。あなたの親切な支援を提供してください。私はプログラミングに慣れていないので、私の愚かさを許してください。このコードとスクリプトでは不可能な場合は、どのようにコードを操作してCSVファイルに重複を見つけることができますか?CSVファイルをpostgreSQLにインポートすると重複しています

import psycopg2 
import csv 

csv_data = csv.reader(file('SampleData2.csv')) 
+0

"私はCSVファイルでの重複を持っているようだ。" なぜ? PostgreSQLはエラーを出しますか?どちらのエラー? –

+1

私はpostgreSQLでクエリを実行すると、count(username)> 1は多くのユーザー名を返します。ユーザー名は重複しない固有のフィールドです。私はそれらの重複をPythonで見たいと思っています。一度見たら、それらを削除できるようにしたいのです。私はこのプロセスをPythonで行いたいと思っています。 –

+1

あなたの質問を編集し、PostgreSQLに関連するすべてのコードを削除することができます。代わりに、CSV入力から重複を削除しようとしたコードを含めてください。 –

答えて

1

複製物を作成せずにファイルをデータベースにインポートできるようにするには、並べ替えの 'UPSERT'を行うことができます。これは更新されます(複製以降は問題になりません)。または新しいレコードを作成します。

これはSO答えてください:Insert, on duplicate update in PostgreSQL?

+0

ありがとうジョシュア、今私はちょうど同じユーザー名を持つ重複のリストを表示したい。 –

関連する問題