2016-08-23 14 views
0

私が提案してください..私は以下のコードとエラーを配置している。.. SQLコンテキストを使用しますが、以下のエラーを取得jsonrdd作成しようとしました。..スパークSQLのJSONエラー

マイコード:

rdd1=sqlContext.jsonRDD('/idn/home/ijamalmo/ibfiles/datafiles/sampledata.json') 

エラー

Traceback (most recent call last):

File "", line 1, in

File "/opt/mapr/spark/spark-1.4.1/python/pyspark/sql/context.py", line 442, in jsonRDD

keyed = rdd.mapPartitions(func) 

AttributeError: 'str' object has no attribute 'mapPartitions'

答えて

0

jsonRDDはpyspark機能ではありません。あなたが欲しい:

rdd1 = sqlContext.read.json('fileLoc').rdd 
+0

sqlCon = SQLContext(SC) RDD1 = sqlCon.jsonFile( 'smapledata.json') をこのコマンドはエラーなしで実行されています。しかし、スキーマを印刷したり、データを印刷しようとすると、エラーが発生しました。 rdd1.printSchema() rdd1.collect() アドバイスをお願いします –

関連する問題