2017-07-10 6 views

答えて

2

RDDをDataFrameに変換して保存することができます。

data.toDF().write.format("orc").save("/path/to/save/file") 

、戻ってそれを読んsqlContext

import org.apache.spark.sql._ 
val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) 

val data = sqlContext.read.format("orc").load("/path/to/file/*") 
を使用するには
関連する問題