2017-06-25 7 views
0

bz2形式のファイルがたくさんあります(それぞれ10GB)。私はそれらをアップロードして、いくつかのクエリを実行したいと思います。大きなクエリはgzipと同じようにbzipを "理解"していますか?私はそれらを変換する必要がありますか?アップロードするにはどうすればいいですか?bzip2のファイルをストレージにアップロードしてbigqueryで使用できますか?

+0

質問をする前に、[よくある質問ですか?](http://stackoverflow.com/help/how-to-ask)をお読みください。 –

答えて

1

ファイルがCSV形式またはJSON形式であると仮定します。 BigQueryのドキュメント(https://cloud.google.com/bigquery/preparing-data-for-loading)では、gzipの圧縮のみがサポートされています。たとえbz2がサポートされていても、10GBサイズの圧縮ファイルを使用することはお勧めできません。問題は、圧縮されていないファイルとは異なり、BigQueryを分割することができず、10GBファイル全体を処理する必要があります。これは非常に遅いでしょう。

+0

圧縮された 'gz'ファイルではなく、圧縮されていない' CSV'ファイルからテーブルを作成するほうが速いと思いますか? – user1367204

関連する問題