2つの大きな未ソートの.csv
ファイルを列1と3に基づいて比較したタスクです。 各ファイルには約200KBのレコードが含まれています。出力に関しては、第1のファイルには第1列と第3列に基づくレコードが存在し、第2のファイルには存在しないレコードを知る必要があります。ファイルはカンマ区切りの値ファイルで引用されます。列3は比較の際に大文字小文字を無視する必要があります。2列に基づく2つの大きなソートされていないCSVファイルの比較
例ファイル1:
"id", "name", "email", "country"
"1233", "jake", "[email protected]", "USA"
"2345", "alison", "[email protected]", "Canada"
"3456", "jacob", "[email protected]", "USA"
"5678", "natalia", "[email protected]", "USA"
ファイル2
"id", "name", "email", "country"
"2345", "alison", "[email protected]", "Canada"
"3456", "jacob", "[email protected]", "USA"
"5690", "lina", "[email protected]", "Canada"
所望の出力ファイル
"5678", "natalia", "[email protected]", "USA"
コードの例は非常に高く評価されるだろう。
言語とどのようなあなたがこれまでに行われ、問題が何ですか? – Mark
なぜ "1233"、 "jake"、 "[email protected]"、 "USA" 'という行は出力に表示されませんか? – brandizzi
こんにちはマーク、私はハッシュマップで、Javaを試して、それは非常に遅いでした。 – Tanya