私は、経験と理解に基づいて、以下のシナリオでスタックオーバーフローメンバーの考えを知りたいと思います。SSISパッケージとETLプログラムを.NETコンソールアプリケーション(C#.NET)に置き換える?
入力として20〜30百万のレコードが入力されます(入力は通常csvまたはxlsファイルで、役立つ場合はDBにアップロードできます)。これらのレコードを処理し、出力ファイルとエラーを含む異なるファイルを生成する必要がありますファイル。したがって、いくつかのビジネスロジックに基づいて、それらのレコードは出力ファイルまたはエラーファイルに移動されます。
現在のところ、このプロセスでは、SSISパッケージと一部のETLツールを使用してそのタスクを実行しています。それらのpkgsとETLツール自体は、入力サイズに応じて、処理に5〜15分かかります。
多数のSSISパッケージとETLプログラムがあります。
これらのSSIS pkgsおよびETLプログラムをいくつかの.NETアプリケーションに置き換えたいとします。 通常、I/Oが.netで遅いため、これらの.netアプリケーションの速度とパフォーマンスに懸念があります。
これに対処する方法はありますか。
質問には多くの間違い、間違い、神話が含まれています。 IOは.NETで遅いですか?本当に?遅いIOは、悪いコード、悪いクエリ、悪いスキーマによって引き起こされます。それは.NETではないからです。 *なぜ*あなたはSSISから離れたいですか?あなたは同じ機能を複製できると思いますか?監視とロギングを含む?ストリーム処理を含む?なぜあなたはコンソールアプリケーションが*より優れていると思いますか? *実際の要件は何ですか? –