2016-07-19 3 views
0

パフォーマンス・チューニングのヒントをinformacalaセッション・レベルで教えてください。 ソースはデータベース(Teradata)で、フラットファイルを生成します。ファイルには何百万というレコードが出てくるでしょう。それで、なぜワークフローが完了するのに長い時間と長い時間がかかるのか。ワークフローをパーティショニングなどのように高速に実行するためのパフォーマンスに関するヒントは、私は何をすべきか分かりません。データベースとしてソースとしてフラット・ファイルを生成する際に、セッション・レベルでパフォーマンスを調整してください。

ありがとう、 Teja。

答えて

0

まず、ボトルネックを特定する必要があります。可能であれば、セッションログに記録されているセッション後の統計情報を共有してください。それは***** RUN INFO FOR TGT...メッセージで始まり、各スレッドに関する情報を持っています。私はここで助けることができた。

次に、問題に対処する方法を考え始めることができます。さらにいくつかのテストが必要になるかもしれません。標準的なアプローチは、いくつかの場所(問題の可能性があると思われる変換前のターゲットの前のSQの後)にマッピングにFALSEフィルタを配置することです。それに応じて行動してください。

不運にも、「速く走らせる」checboxはありません。いくつかのセッションプロパティ、特に許可されたメモリ、コミットのタイプと間隔、バッファの長さなどを試すことができます。しかし、診断と問題解決がまず必要です。

関連する問題