をオークテーブルを読み取ることができない私は、Sparkとオークのテーブルを読むことができるように特別な何かをする必要がありますか?スパークは、(空のテーブルを返します)
私はTXTやオークで2つのテーブルのコピーを持っています。 txtテーブルを読むときは、すべてが大丈夫です。 orcテーブルを読むときはエラーは出ませんが、sparkは空のテーブルを返します。ここで
はPythonで私のコードです:
import pyspark
CONF = (pyspark.SparkConf().setMaster("yarn-client"))
sc = pyspark.SparkContext(conf = CONF)
from pyspark.sql import HiveContext
sq = HiveContext(sc)
df = sq.sql(""" select * from sample_07 """)
print df.show(10)
UPDATE:私はsample_07に格納されたデータへのパスを指定し、一時テーブルとして登録した場合
、それはしかし動作します:
sq = HiveContext(sc)
orcFile = sq.read.format("orc").load("/user/some/sample_07/")
orcFile.registerTempTable("tempTableName");
df = sq.sql("SELECT * FROM tempTableName LIMIT 10 ")
はい、私はそれを試してみました。それは何の違いもありません – facha