|
(パイプ)で区切られたフラットファイルが多数あります。このフラットファイルは、SSISパッケージを使用してSQL Serverで毎日処理します。各フラットファイルは、ヘッダーセクション、コンテンツセクション、フッターセクションに分かれています。私たちは定期的に同じファイルの新しいバージョンを取得します。我々は、処理の負荷を軽減するために、同じファイルの2つのバージョン間でファイル比較機能を実装しようとしています。2つのフラットファイルの内容を比較する最良の方法
どの方法がより効率的になりますか?
サム列を持つ別のSQL Serverのテーブルに同じファイルの両方のバージョンを保存し、チェックサム値が一致していないいる行を除外。
C#または他のC#で利用可能な他の比較アルゴリズムで同様のチェックサムロジックを実装する。
これを達成するための他の新しいアルゴリズムをお勧めします。
ファイルの内容を少し貼り付けることはできますか? –
Muraliのためにこれはうまくいったのですか? – scsimon
Verson 1ファイル: H1 | 11 | 111111111111111 | | 111111111 | AAAAAAA | 2222222 | 20160205 | H2 | 33 |テストテスト| 2 | 2 | 2 | 2 | 2 | 2 | 3 | 20160205 H3 | 33 | 44 | 55 | 55 | 66 | 77 | Verson 2ファイル: H1 | 11 | 55555555555 | | 7777777 | bbbbbbbb | 666666 | 20160205 | H2 | 33 |テストテスト| 2 | 2 | 2 | 2 | 2 | 2 | 3 | 20160205 H3 | 33 | 44 | 55 | 55 | 66 | 77 | –