私は単純なsparkRのサンプルを起動して動作させることに取り組んでおり、動作させることはできません。私がしたいのは、リストを作成してパラレル化し、SparkRで関数を実行することだけです。私は火花1.6でこれを行うための道を行く単純な例を見つけることができませんでした - それを行う多くの方法があるようだが、それらのどれもうまくいかないようです。私はsparkRコンソールでこれを実行しようとしています:シンプルなSparkR 1.6の例
fxntest<- function(i){
m = matrix(runif(4000*4000),4000)
return(system.time(m %*% m))
}
a<-c(1,1,1,1,1,3)
b<-as.list(a)
sdf <- createDataFrame(sqlContext, b)
testtimes <- lapply(sdf, fxntest)
testtimelist <- collect(testtimes)
testtimelist
これはlapplyが呼び出されているときに私が取得していますエラーです:
Error in as.list.default(X) :
no method for coercing this S4 class to a vector
私が探しています何を取得する非常に簡単な例でありますこの作業 - 私はpyspark良い量を使用しているが、これはR.
エラーは「lapply」に表示されます。それは何ですか?それは全く「i」を使用していません –
私はちょうどその機能を別の労働者の間で並行して実行したいと思っています - 私は "私"を無視していることを知っています。 – TH22