フラットファイルからデータをロードしようとしています。このファイルのサイズは約2.5 GBで、行数は10億に近いです。 DFT内でフラットファイルソースを使用しています。ファイル内のいくつかの行は列パターンに従いません。たとえば、1つの列の値として余分な区切り記号やテキスト修飾子があります。私はそれらの行をスキップし、正しいフォーマットを持つ残りの行をロードしたいと思います。私はSSIS 2014を使用しています。DFT内のフラットファイルソースは失敗しています。 alwaysCheckforrowdelimiterプロパティをfalseに設定しましたが、それでも動作しません。ファイルが大きすぎるので手動で開閉することはできません。親切に助けてください。ssisのフラットファイルからエラー行をスキップ
0
A
答えて
0
私はNick.McDermaidと同じアイデアを持っていますが、もう少しお手伝いできます。 ファイルを正規表現で消去することができます。 (スクリプトの中で)
あなたが望む区切り文字の数と行を一致させる正規表現を定義する必要があります。他の行は削除する必要があります。
^[A-Z]*;[A-Z]*;[A-Z]*;[A-Z]*$
とデータサンプル:
AA;BB;CC;DD
AA;BB;CC;DD
AA;BB;CC;DD;EE
AA;BB;CC;DD
AA;BB;CC
AA;BB;CC;DD
AA;BB;CC;DD
あなたがここに
はここでメモ帳++
で実行視覚的な例私の例に使用するパターンですオンラインで試すことができます:https://regex101.com/r/PIYIcY/1
よろしく、 アルノー
関連する問題
- 1. フラットファイルからのSSISカラム数
- 2. SSISがフラットファイルから特定の行をインポートする
- 3. SSISフラットファイルの列デリミタ
- 4. フラットファイルへのSSIS出力0.00
- 5. 行をスキップ:SSISからExcelファイルにデータをエクスポート
- 6. フラットファイルから空白を保持するSSIS
- 7. フラットファイルからテーブルへのロードに適したssisデザインパターン
- 8. SSIS - 別のサーバーにフラットファイルを保存
- 9. Informatica PowerCenter Designer:フラットファイルから第1列をスキップ
- 10. SSIS - DT_IMAGEデータ型がフラットファイルにエクスポートされます。エラーの取得
- 11. フラットファイル宛先のヘッダー行にSSIS変数を含める方法
- 12. データソースとしてのフラットファイルのフォルダSSIS
- 13. SSIS - イメージデータ型列をフラットファイルにエクスポート
- 14. 可変列番号を持つSSISフラットファイル
- 15. ssisをフラットファイルに追加する
- 16. SSISにフラットファイル(.txt)を同時にロード
- 17. SSISフラットファイルは、[DT_DBTIMESTAMP]カントSQLのDATETIME2
- 18. SSISフラットファイル - 複数行のファイルでCSVフォーマットが機能しない
- 19. SSIS:フラットファイル - 値として表示
- 20. SSISのフラットファイルからSQLテーブルに1週間のデータをロードする方法
- 21. SSISでフラットファイル名を取得し、異なる列の複数のフラットファイルから行数をどのように取得しますか?
- 22. フラットファイルからリレーショナルテーブル
- 23. SSISフラットファイルからの読み込みに問題があります
- 24. リモートマシンからSSISを実行
- 25. SSISパッケージの検証エラー - フラットファイルの宛先にIDがありません
- 26. 複数の形式ファイルを含むSSISでフラットファイルをインポートする
- 27. SSIS 2012 - 埋め込みのバックスラッシュを含むフラットファイルをインポートする
- 28. SSIS 2014 - 異なる数の列を持つフラットファイルの宛先
- 29. コマンドラインからSSISパッケージを実行中にエラーが発生する
- 30. エラー実行パッケージSQL ServerエージェントからのSSISですが、カタログ
これは1がオフになっている場合は、私はあなたがファイルを検索し、事前にそれをきれいにするスクリプト(VBScriptの、PowerShellを、何でも)使用することを提案します。 –
十億行に及ぶファイルのためのスクリプトはありがたいですが、時間がかかります。これは毎日予定されている仕事の一部であり、一定の時間内に完了する必要があります。 –
それは時間がかかるでしょうか? 10億行の場合、多分おそらく最大30分かかりますか?区切り文字が多すぎると認識できない場合があります.1つ左のフィールドをシャッフルするだけの場合があります。とにかくそれを考慮したいかもしれません。 –