0
文字列またはRDDを引数として受け取り、データフレームを返す関数を作成しようとしています。パラメータとしてRDDを渡し、関数/スカラにデータフレームを返します
コード:
def udf1 (input: String) = {
val file = sc.textFile(input);
file.map(p => Person(
(p.substring(1, 15)),
p.substring(16, 20))).toDF()
}
def main() {
case class Person(id: String, name: String)
val df1 = udf1 ("hdfs:\\")
}
が、それはRDD常にretuns。助言がありますか?
iは戻り値の型を定義していなかったてもよいです。それは私がDataFrameが働くリターンを定義するなら働きます。ありがとう! – user1122