2017-09-16 13 views
0

私はカスタムスパークデータソースを持っています。データはJavaライブラリから提供されています。一部のフィールドはArrayTypeで、時にはNULLです。私は配列フィールドをNone、null、lit(null)、Option(null)、おそらくいくつかの他のバリアントに設定しようとしましたが、配列フィールドを解決しようとすると触媒がNPEを投げます。spark 2カスタムデータソース - 配列列をnullに設定するにはどうすればいいですか?

私が知る限り、CatalystはArrayConverter(CatalystTypeConverters.scalaの)のtoCatalystImpl()メソッドでnullのチェックを行いません。これはCatalystのバグですか、あるいはデータフレームArrayTypeフィールドのための他のヌルエンコーディングがありますか?

+0

この質問は関連していますか? https://stackoverflow.com/questions/39734453/spark-dataframe-column-nullable-property-change – stealththeninja

答えて

0

私の悪いことに、問題を発見しました(間違ったコードをハッキングしました)。最終的な答えは "Option(null)"のようです。私はNoneとlit(null:)を試しましたが、どちらも例外を投げました。

関連する問題