が、私はここでformat-CSVへの追加欠損値は
X,Y
0,0
0,1
0,2
1,0
1,1
2,0
2,1
2,1
以下でソートCSVファイルを持って、値1,2
が存在しないファイル。これは単なるサンプルであり、私のファイルには何百万ものレコードが含まれています。これらの値を検出してファイルに追加するスクリプトを作成するにはどうすればよいですか?
は、私はすべての可能なペアを生成しようと、彼らはファイルかどうかに存在しているかどうかを確認、しかしあまりにも遅いですしている
import csv
with open('myfile.csv') as csvfile:
r = csv.reader(csvfile, delimiter=',')
for row in r:
for i in range(1000):
for j in range(1000):
if (int(row[0]) == i and int(row[1]) == j):
# Can perform operations here
私はnumpyのか、パンダを使用することができますいくつかの方法は、(私はあります非常にそれらの新しい)この問題を解決するには?セットを使用して
が、それはいくつかの学術的な理由のためですか?それ以外の場合は、すべての可能なペアを生成し、欠落をチェックするのではなく、ファイルに書き込むだけです。 –
実際には、レコードごとにカウント値を持つ列が追加されています。 – amadispstac