2016-05-24 13 views
1

これらの例で見たように、Gson経由でしか実行できません。 Spark Connectorを介してAvroオブジェクトをBigQueryテーブルに直接ロードすることは可能ですか? AvroからBigQueryへの変換avroの仕様が単純なプリミティブ値を超え始めると、Jsonは苦痛になります。 (例えば労働組合)Sparkコネクタ経由でAvroをBigQueryにロード

乾杯スパークコネクタを介して

答えて

1

ないが、BigQueryに直接AVROファイルをロードサポートしています。https://cloud.google.com/bigquery/loading-data#loading_avro_files

+0

おかげで、私はこれが動作すると思います。しかし、GoogleではAvro C++ライブラリを使用しているため、すでに動作しているように見えることがあります。これがどこに文書化されているか分かりますか?私の列のほとんどは、いくつかの共用体を持つプリミティブ型です。私はまた、スナッピー圧縮形式を使用しています。 –

+0

実行中の警告はわかりませんが、一般にプリミティブ型とスナッピー圧縮はすべてサポートされています。具体的な問題については、https://code.google.com/p/google-bigquery/ –

+1

でバグを報告することをお勧めします。すべてのAvroデータタイプはC++ライブラリとBQでサポートされています(一部のコンバージョン、バイトまで)。スナッピーを使用して圧縮されたデータブロックはサポートされていません。 Deflateは、C++ライブラリでサポートされている唯一のコーデックです。 –

関連する問題