3
私は(thisに類似)PySparkに2つのデータフレーム(DF1とDF2)のために参加したカスタムを作成しようとしているを使用して参加します私は次のようになります:Pysparkデータフレームは、このようなコードで、UDF
java.lang.RuntimeException: Invalid PythonUDF PythonUDF#<lambda>(col_a#17,col_b#0), requires attributes from more than one child
2つの別々のデータフレームから列を処理できるPySpark UDFを書く方法はありますか?あなたはcrossJoin
を使用したり、クロスを有効にする必要が