0

私は私は1つのデータベース(postgresの)からデータをフェッチしていたシナリオを持っているからデータを取得し、別のデータベースのテーブルにデータをロードする(赤方偏移)Pentahoはケトル - 異なるデータベース

はケトルにとにかくありこの仕事をスケジュールするには?

その赤方偏移は、バルク挿入のために最適化されているようではなく、行ごと挿入かなり遅いことができるテーブル出力工程を用いinsert into redshift select * from postgres

+0

テーブル入力(ポストグルへの接続) - >テーブル出力(赤色シフトへの接続)。必要があれば、間にデータ型を調整します。 – simar

+0

amazon redshift用のjdbcドライバを入手し、$ KETTLE_HOME/libにコピーします。 – simar

答えて

1

シンプル。 AFAIK、Redshiftに一括挿入するためのケトルにはステップ/プラグインはありません。 S3へ

  • コピーデータをファイルにはPostgresから

    1. ダンプデータ:https://anotherreeshu.wordpress.com/2015/11/30/loading-data-to-aws-s3-bucket-pentaho-data-integration/
    2. がS3からの赤方偏移にデータを挿入します。https://anotherreeshu.wordpress.com/2015/12/11/loading-data-from-s3-to-redshift-pentaho-data-integration/あなたが何ができるか、シェルのステップでスクリプトを作ることです
  • 関連する問題