sparkでのUDFの使用

私はカスタムudfを持っていて、sparkに登録しています。そのUDFにアクセスしようとすると、error.Unableにアクセスします。sparkでのUDFの使用

このようにしてみました。すべてのヘルプは理解されるであろう

最初（rssi_weightage（$ "RSSI"）// rssi_weightageが見つからないというエラーでエラーを表示

spark.udf.register("rssi_weightage", FilterMap.rssi_weightage) 
val filterop = input_data.groupBy($"tagShortID", $"Timestamp", $"ListenerShortID", $"rootOrgID", $"subOrgID").agg(first(rssi_weightage($"RSSI").as("RSSI_Weight")))

。

出典

2017-08-10 Jessi joseph

私のソリューションはあなたの質問を解決しましたか？はい、答えが –

は、これはあなたがUDFを使用する方法を、実際ではありませんUDFはspark.udf.registerからの戻り値であるあなたがすることができるので：。

val udf_rssii_weightage = spark.udf.register("rssi_weightage", FilterMap.rssi_weightage) 

val filterop = input_data.groupBy($"tagShortID", $"Timestamp", $"ListenerShortID", $"rootOrgID", $"subOrgID").agg(first(udf_rssi_weightage($"RSSI")).as("RSSI_Weight"))

しかし、あなたの場合にはあなただけのReguを変換するorg.apache.spark.sql.functions.udfを使用して、UDFを登録する必要はありませんがUDFにLAR機能：

val udf_rssii_weightage = udf(FilterMap.rssi_weightage)

出典

2017-08-10 08:07:55

の場合はお返事ありがとうございます... –

良い1つ：@ラファエル、upvoteにふさわしい –

私は次のスナップショットが発表UDFにわずかに異なるアプローチを持っている、あなたがUDF関数を定義している方法で問題があるとします - それは直接の関数定義されています：インポートorg.apache.spark.sql.functions._

val data = sqlContext.read.json(sc.parallelize(Seq("{'foo' : 'Bar'}", "{'foo': 'Baz'}"))) 

val example = Seq("Bar", "Bazzz") 
val urbf = udf { foo: String => if (example.contains(example)) 1 else 0 } 

data.select($"foo", urbf($"foo")).show 

+--------+-------------+ 
| foo |UDF(foo)  | 
+--------+-------------+ 
| Bar |   1| 
| Bazzz |   0| 
+--------+-------------+

出典

2017-08-10 09:10:05

あなたの解決のおかげで... –

答えて

関連する問題