2017-10-26 16 views
0

私は2つのファイルdata.csvとheaders.csvを持っています。私は、ヘッダーを使ってspark/scalaでdataframeを作成したいと思います。ヘッダとデータファイルを使用してヘッダ付きデータフレームを作成

var data = spark.sqlContext.read.format(
    "com.databricks.spark.csv").option("header", "true" 
    ).option("inferSchema", "true").load(data_path) 

これを行うには上記の行をカスタマイズできますか?

+0

有用であると思います上記の方法を使用してheaders.csvを読み、

val headersDF = sqlContext .read .format("com.databricks.spark.csv") .option("header", "true") .load("path to headers.csv") val schema = headersDF.schema val dataDF = sqlContext .read .format("com.databricks.spark.csv") .schema(schema) .load("path to data.csv") 

以下のようdata.csvを読み取るために、ヘッダーdataframeschemaを使用することができますヘッダーオプションを使用してスキーマを作成し、そのスキーマをdata.csvに使用します。 –

答えて

3

あなたは、私は答えはあなたが使用してheaders.csvを読ん

+0

ありがとうございました:) – Ravikrn

+1

それを聞いて嬉しいです:)あなたも答えを受け入れることができます:) –

+1

@Ravikrn答えを提供する回答者のために貴重な時間がかかります。提案されたソリューションが機能してから、いくつかの礼儀を示し、答えを受け入れてください。 – desertnaut

関連する問題