Sparkで列の1つに配列が含まれているデータフレームがあります。異なる値を持つ別の配列に配列します。Spark Error:ClassDict(numpy.core.multiarray._reconstruct用)の構築にゼロ引数が必要です
例:[24,23,27,23]がに変換し得るべきである[24、23、27] コード:上記のコードで
def uniq_array(col_array):
x = np.unique(col_array)
return x
uniq_array_udf = udf(uniq_array,ArrayType(IntegerType()))
Df3 = Df2.withColumn("age_array_unique",uniq_array_udf(Df2.age_array))
、Df2.age_array
以下の例を参照UDFを適用して別の列"age_array_unique"
を取得する配列です。この配列には、配列内で一意の値のみを含める必要があります。
はしかし、すぐに私は、コマンドDf3.show()
を実行すると、私はエラーを取得する:
net.razorvine.pickle.PickleException: expected zero arguments for construction of ClassDict (for numpy.core.multiarray._reconstruct)
誰もがなぜこれが起こっている私に知らせてくださいことはできますか?
ありがとうございます!
誤植を?数値をNumPy型に変換します。これは互換性がありません " –