0
例をthis postにして、DataFrame
をCSVとしてAWS S3バケットに書き出しました。結果は単一のファイルではなく、多数の.csvファイルを含むフォルダでした。私は今、このフォルダでSparkRのDataFrame
として読み込みに問題があります。以下は私が試したものですが、私が書いた同じDataFrame
にはなりません。DataFrameから書き込んだ後にcsvデータを読み込む
write.df(df, 's3a://bucket/df', source="csv") #Creates a folder named df in S3 bucket
df_in1 <- read.df("s3a://bucket/df", source="csv")
df_in2 <- read.df("s3a://bucket/df/*.csv", source="csv")
#Neither df_in1 or df_in2 result in DataFrames that are the same as df