私は2つのファイルdata.csvとheaders.csvを持っています。私は、ヘッダーを使ってspark/scalaでdataframeを作成したいと思います。ヘッダとデータファイルを使用してヘッダ付きデータフレームを作成
var data = spark.sqlContext.read.format(
"com.databricks.spark.csv").option("header", "true"
).option("inferSchema", "true").load(data_path)
これを行うには上記の行をカスタマイズできますか?
有用であると思います上記の方法を使用して
headers.csv
を読み、以下のよう
data.csv
を読み取るために、ヘッダーdataframe
のschema
を使用することができますヘッダーオプションを使用してスキーマを作成し、そのスキーマをdata.csvに使用します。 –