2016-11-07 11 views
0

sqoopエクスポートを介してHiveからNetezzaにデータをエクスポートする際のパフォーマンス上の問題に直面しています。sqoop export performance問題

sqoopのパフォーマンスを改善する方法はありますか? sqoop exportコマンドで

columns present in the table(source and destination) : 282 
format of file : text 
no of splits: 99 
data to be exported : 1000 MB 
+0

サンプル 'sqoop'コマンドを追加できますか? –

+0

私はプロセスを複数のスレッドに分割するようにお願いします。転送速度を向上させることができる並列ロード – NzGuy

+0

sqoop export -Dmapreduce.job.queuename = QUEUENAME --connect jdbc:netezza://SERVER_STRING/DB_NAME - ユーザー名USER --password-file/PATH - テーブルTABLE_NAME --batch --columns "282個のCOLOUMNSのリスト" --export-dir/DIR_PATH - 入力フィールド-pending-by '001 ' - 行末' \ n ' - 入力ヌル文字列 "\\\ N" - 入力ヌル非文字列 "\\\ N" -m 100 –

答えて

1

使用-batch:

は、ここで詳細です。

さらにデータロードを改善するには、--directを使用します。 制限事項:このモードでは、バイナリおよびラージオブジェクトタイプはサポートされていません。

0

Sqoopジョブに割り当てられるクラスタのサイズと最大スロット数はいくつですか?したがって、-mを与えます。全体の処理時間が長くなります。しかし、sqoopのエクスポートがアトミックプロセスでないことを確認してください。ステージングテーブルを作成し、ステージングテーブルを使用してデータをエクスポートしてください。そうでないと、データが矛盾する可能性があります。

関連する問題