私はカスタムスパークデータソースを持っています。データはJavaライブラリから提供されています。一部のフィールドはArrayTypeで、時にはNULLです。私は配列フィールドをNone、null、lit(null)、Option(null)、おそらくいくつかの他のバリアントに設定しようとしましたが、配列フィールドを解決しようとすると触媒がNPEを投げます。spark 2カスタムデータソース - 配列列をnullに設定するにはどうすればいいですか?
私が知る限り、CatalystはArrayConverter(CatalystTypeConverters.scalaの)のtoCatalystImpl()メソッドでnullのチェックを行いません。これはCatalystのバグですか、あるいはデータフレームArrayTypeフィールドのための他のヌルエンコーディングがありますか?
この質問は関連していますか? https://stackoverflow.com/questions/39734453/spark-dataframe-column-nullable-property-change – stealththeninja