1
HDFSとS3に保存されたAvroファイル(BZIP2を使用して圧縮されたファイル)をAmazon Redshiftにロードしたい。コピーコマンドでエラーが発生します。Amazon redshift:BZIP2を使用して圧縮されたAvroファイルを読み込む
error: Invalid AVRO file
code: 8001
context: Cannot init avro reader from s3 file File header contains an unknown codec
Redshiftは圧縮Avroファイルをサポートしていませんか?
この場合、このデータをRedshiftにロードするための最も優れたオプションは何ですか(圧縮せずにAvroファイルに戻すことはできません)。
sqoopを使用できますか?
あなただけの組み込みのスキーマファイルのを使用している場合は、JSONのパスを指定する必要はありません - ちょうど「アブロ 『自動』としてフォーマット」を行うことができ、http://docs.awsを参照してください。 amazon.com/redshift/latest/dg/r_COPY_command_examples.html#copy-from-avro-examples-using-auto – subelsky