0
私が提案してください..私は以下のコードとエラーを配置している。.. SQLコンテキストを使用しますが、以下のエラーを取得jsonrdd作成しようとしました。..スパークSQLのJSONエラー
マイコード:
rdd1=sqlContext.jsonRDD('/idn/home/ijamalmo/ibfiles/datafiles/sampledata.json')
エラー
Traceback (most recent call last):
File "", line 1, in
File "/opt/mapr/spark/spark-1.4.1/python/pyspark/sql/context.py", line 442, in jsonRDD
keyed = rdd.mapPartitions(func)
AttributeError: 'str' object has no attribute 'mapPartitions'
sqlCon = SQLContext(SC) RDD1 = sqlCon.jsonFile( 'smapledata.json') をこのコマンドはエラーなしで実行されています。しかし、スキーマを印刷したり、データを印刷しようとすると、エラーが発生しました。 rdd1.printSchema() rdd1.collect() アドバイスをお願いします –