s3位置から赤色シフトテーブルにスナップ圧縮ファイルをロードするにはどうすればよいですか?スナップ圧縮ファイルまたはORC形式をタブ区切り.csvファイルに変換する方法スナップ圧縮ファイル用の赤色シフトロード
答えて
Amazon Redshiftは、ネイティブにsnappy
またはORC
ファイルをインポートできません。
COPY commandリスト以下のサポートされるファイル形式のためのアマゾンの赤方偏移のドキュメント:
- CSV
- DELIMITER
- 固定幅
- AVRO
- JSON
- BZIP2
- GZIP
- lzopの赤方偏移にインポートする(例えばアマゾンEMRを使用して)あなたは、外部のファイル形式を変換する必要があります
前。
ありがとうJohn !!圧縮ファイル(スナッピー圧縮またはORC)をRedshiftローダブルフォーマットに変換する汎用ソリューションはありますか? – pRavin
ORCとスナッピーはほとんどの場合、Hadoop環境でのみ使用されます。現在Hadoopを使用していない場合は、Amazon EMR環境を起動し、Hiveを使用してフォーマットを変換することができます。例:[.txt/.csvファイルをORC形式に変換する方法](https://stackoverflow.com/questions/25117760/how-to-convert-txt-csv-file-to-orc-format)私は[CloudConvert](https://cloudconvert.com/formats)を見ましたが、SnappyもORCもサポートしていません。 Snappy/ORCファイルを受け取っている場合は、おそらくHadoopによって生成されているので、ソースシステムから変換される可能性があります。 –
ありがとうジョン。私は、コマンドhadoop fs -text <圧縮ファイル>を使用して、スナップ圧縮ファイルを変換しています。しかし、これはORCではなくスナッピーでしか機能しないようです。 – pRavin
- 1. Elastic MapReduceにスナップ圧縮ファイルをロード
- 2. 2色画像圧縮アルゴリズム
- 3. JPEG圧縮アーティファクト(緑色ピクセル)
- 4. 圧縮ファイル.pngファイル
- 5. Spark SQL - gzipとスナップとlzoの圧縮形式の違い
- 6. PowerShellのファイル圧縮
- 7. MDBファイルの圧縮
- 8. クロスプラットフォームのファイル圧縮
- 9. teeを圧縮ファイル
- 10. jpegoptim doesnt圧縮ファイル
- 11. androidのファイルがいっぱいのフォルダを圧縮/圧縮
- 12. ディープ・ズーム・イメージ・ファイルの圧縮
- 13. 圧縮ファイルの監視
- 14. S3のファイルを圧縮
- 15. MDzipファイルの再圧縮
- 16. JavaでのLZ4ファイル圧縮
- 17. 静的ファイル用.NET Coreレスポンス圧縮ミドルウェア
- 18. SharpZipLib:1つのファイルを1つの圧縮ファイルに圧縮する
- 19. node.js(Electron)を使用して圧縮されていないxlsxファイルを圧縮
- 20. apache圧縮圧縮されていない.jsファイルと.cssファイルを圧縮解除しますか?
- 21. スタティックLZMA圧縮ファイルをプログラムで圧縮解除する
- 22. Spark com.databricks.spark.csvはノードスナッピーを使用してスナップ圧縮ファイルを読み込むことができません
- 23. 圧縮ファイルの文字列を圧縮ファイルで検索します。
- 24. GZIP圧縮+ htaccessファイルは
- 25. TIFファイルを圧縮する
- 26. Amazon Athenaと圧縮S3ファイル
- 27. QuaZIPでファイルを圧縮
- 28. データ圧縮と画像圧縮の差
- 29. LZ4:圧縮画像フォーマットの圧縮
- 30. jsf用のgzip圧縮
この[URL](http://stackoverflow.com/help)をご確認ください。コンテンツの品質を向上させるのに便利です –