問題は、NULL値を持つGBQからデータを読み込んだときに、NULL値の列で関数をマップしようとするとエラーが発生することです。Google Cloud Dataflow PythonでBigQueryのヌル値を扱う
input_dataをGBQからtextに書き出すと、json出力ファイルにはnull値のキーがありません。これは修正する必要がある問題だと私は信じています。例えば
: - 入力 key_1,key_2,key_3 value_1,,value_3
予想される出力:
{"key_1":"value_1","key_2":null,"key_3":"value_3"}
データフロー 今の
{"key_1":"value_1","key_3":"value_3"}