私はdapply()を使っていくつかの関数を適用し、新しい列を追加したいSparkDataFrameを持っています。SparkDataFrameのスキーマを編集するには?
sparkRのdapplyは、呼び出された関数の出力と一致するスキーマを必要とします。 たとえば、
#Creating SparkDataFrame
sdf<-as.DataFrame(iris)
#Initiating Schema
schm<-structType(structField("Sepal_Length", "double"),structField("Sepal_Width", "double"),structField("Petal_Length","double"),structField("Petal_Width","double"),structField("Species","string"),structField("Specie_new","string"))
#dapply code
sdf2<-dapply(sdf,function(y)
{
y$Specie_new<-substr(y$Specie,nchar(y$Species)-1,nchar(y$Species))
return(y)
},schm)
同じ方法を実行する方法はありますか?私は100列あれば、これは実現可能な選択肢ではないでしょう、私はこれらのケースで何をすべきですか?