2017-05-31 9 views

答えて

4
  • DataFrameからHDFS(Spark 1.6)を書きます。

    df.write.save('/target/path/', format='parquet', mode='append') ## df is an existing DataFrame object. 
    

フォーマットオプションのいくつかは、csvparquetjson等HDFS(1.6スパーク)からデータフレームを読み取る

  • あります。

    sqlContext.read.format('parquet').load('/path/to/file') 
    

formatメソッドは、などparquetcsvjson

+0

として引数をとりねえ、私はattributErrorを得る:DataFrameWriter CSV 'オブジェクトには属性がありません'。 また、後でそのデータフレームを読む必要があります。これは、私が新しいsparkセッションで考えると思います。 – Ajg

+0

あなたのスパークのインストールのバージョンは何ですか? –

+0

spark version 1.6.1 – Ajg

関連する問題