結果をテキストファイルに保存する前に、Spark SQL Query結果にヘッダーを追加するにはどうすればよいですか?databricks libを使用せずにSpark SQLクエリ結果に列見出しを追加する方法は?
val topPriceResultsDF = sqlContext.sql("SELECT * FROM retail_db.yahoo_stock_orc WHERE open_price > 40 AND high_price > 40 ORDER BY date ASC")
topPriceResultsDF.map(x => x.mkString(",")).saveAsTextFile("/user/sparkuser/myspark/data/output/yahoo_above40_results(comma).csv")
にのみデータを保存するが、私は同様に (日付、open_price、HIGH_PRICE、LOW_PRICE、close_price、体積、adj_price)のようなヘッダを追加する必要があります。誰かが考えたら助けてください!私はdatabricksライブラリを使用することはできません。
O/Pは
date,open_price,high_price,low_price,close_price,volume,adj_price
1997-07-09,40.75008,45.12504,40.75008,43.99992,37545600,1.83333
おかげのようにする必要があります!
をあなたはハイブテーブルからの読み込みをしていますか? –
Hiveテーブルからはいですが、違いはありません。 –
このプロパティで試すことができます 'sqlContext.setConf(" set hive.cli.print.header "、" true ")'あなたが 'HiveContext'を使用していることを確認してください。 –