2017-10-23 10 views
1

S3バケットからインポートされたデータを含むAWSのElastic MapReduceクラスタでRコードを実行しています。私はSparkRライブラリを使ってApache Sparkのいくつかの機能をテストしています。ここに私が走ろうとしているコードがあります。R(AWS上)のサンプル()で使用されていない引数(replace = FALSE)エラー

mnist_train <- SparkR::read.df("s3a://spark-rstudio-test-new/mnist_train.csv", 
        header = "false", source = "csv", 
        inferSchema = "true", na.strings = "") 
subsamplesize <- 30000 
subsample <- sample(nrow(mnist_train), subsamplesize, replace = FALSE) 

これは、次のエラーを返し:

"サンプル中のエラー(nrow(mnist_train)、subsamplesize、= Fを置き換える): 未使用引数(= Fを置き換える)"

同じ部分をコードは私のローカルRStudioで動作します。何が起きてる?私はどんな方向にもとても感謝しています。

答えて

0

互換性のない署名が付いているSparkRの実装は、baseのものです。完全修飾名を使用すると、そのトリックを行う必要があります:

base::sample(nrow(mnist_train), subsamplesize, replace = FALSE) 
+0

これは、ありがとう! –

関連する問題