0
登録後にcallUDFを使用してudfを呼び出そうとしています。ただし、関数validateNumber()は呼び出されません。callUDF()でUDFを呼び出せません - Spark Java
コードは以下のようになります。私がしようとしています
public Dataset<Row> sampleCallUdf(Dataset<Row> dataset) {
UDF2<Long, Long, String> validateNumber = (UDF2<Long, Long, String>) SampleClass::validateNumber;
UDFRegistration udfRegister = CONFIG.getSparkSession().udf();
udfRegister.register("validateNumber", validateNumber, DataTypes.StringType);
return dataset.withColumn("rejection_reason",
coalesce(
callUDF("validateNumber", column("cookie"), column("session"))));
}
public static String validateNumber(Long cookie, Long session) {
System.out.println("Into validateNumber function");
if(cookie != 0){
return "correct";
}else{
return "incorrect";
}
}
入力は次のとおりです。
Dataset<Row> input = spark().createDataFrame(Arrays.asList(
RowFactory.create("28/05/2017 00:12:34", 0L, -2864001245604480000L, "abc" ,"90.202.190.106", 123, "abc", "xyz", "mno"),
RowFactory.create("28/05/2017 00:12:34", 2345678L, 2864001245604480000L, "abc" ,"90.202.190.106", 123, "abc", "xyz", "mno")), TEMP_TABLE);
問題はそれもvalidateNumber()関数内でSYSOUT文を印刷していない、です。
私のためにうまく動作します。データセットの値を確認してください。 – abaghel
@abaghel - validateNumber()に入りましたか? – anukuls
また、あなたが入力していることを教えてください。 – anukuls