spark 2カスタムデータソース - 配列列をnullに設定するにはどうすればいいですか？

私はカスタムスパークデータソースを持っています。データはJavaライブラリから提供されています。一部のフィールドはArrayTypeで、時にはNULLです。私は配列フィールドをNone、null、lit（null）、Option（null）、おそらくいくつかの他のバリアントに設定しようとしましたが、配列フィールドを解決しようとすると触媒がNPEを投げます。spark 2カスタムデータソース - 配列列をnullに設定するにはどうすればいいですか？

私が知る限り、CatalystはArrayConverter（CatalystTypeConverters.scalaの）のtoCatalystImpl（）メソッドでnullのチェックを行いません。これはCatalystのバグですか、あるいはデータフレームArrayTypeフィールドのための他のヌルエンコーディングがありますか？

出典

2017-09-16 user2879837

この質問は関連していますか？ https://stackoverflow.com/questions/39734453/spark-dataframe-column-nullable-property-change – stealththeninja

私の悪いことに、問題を発見しました（間違ったコードをハッキングしました）。最終的な答えは "Option（null）"のようです。私はNoneとlit（null：）を試しましたが、どちらも例外を投げました。

出典

2017-09-16 17:19:41 user2879837

spark 2カスタムデータソース - 配列列をnullに設定するにはどうすればいいですか？

答えて

関連する問題