は私のcsvファイルの内容の最初のローにnull値を持つ列を読み取れません:スパークは以下
A1,B1,C1
A2,B2,C2,D1
A3,B3,C3,D2,E1
A4,B4,C4,D3
A5,B5,C5,,E2
ので、5列が、最初の行の唯一の3つの値があります。
私は、次のコマンドを使用して、それを読む:
val csvDF : DataFrame = spark.read
.option("header", "false")
.option("delimiter", ",")
.option("inferSchema", "false")
.csv("file.csv")
そして、次は私がcsvDF.showを(使用して得るものです)
+---+---+---+
|_c0|_c1|_c2|
+---+---+---+
| A1| B1| C1|
| A2| B2| C2|
| A3| B3| C3|
| A4| B4| C4|
| A5| B5| C5|
+---+---+---+
を私はすべての列内のすべてのデータを読み取ることができますどのように?
として
dataframe
を取得すべきですか? A1、B1、C1の代わりに行1の場合と同様に、A1、B1、C1 ,, – Tomです。これは回避策であり、csvが他の誰かによって管理されている場合は機能しません。 –
スキーマを手動で指定するだけです。 –