1
私はSparkとScalaの世界と交流しています。スプリット関数で省略されたヌルフィールド - Spark Scala
Iは、次のデータを含むファイルを有する:
1.1|AGDT970HH|02|2011|N|||||
110000000000|0.00|0.00|0.00|1485976093.32|
110100000000|0.00|0.00|0.00|248871036.86|
110200000000|0.00|0.00|0.00|229610905.15|
110201000000|0.00|0.00|0.00|256660759.36|
110202000000|0.00|0.00|0.00|234105514.15|
110203000000|0.00|0.00|0.00|-261155368.36|
110300000000|0.00|0.00|0.00|280990.61|
常にファイルの最初の行が他の行と比較して異なるレイアウトを有するであろうが。私はそれを別の治療を提供したいので、私は(ヌルものも含めて)最初の行の値を取得しようとする。そのため
:
val fileToRead = sc.textFile("FileName")
val firstRow = fileToRead.first.split("\\|")
しかし、私のfirstRowのフィールドが作成されますヌル値を含まない:
値を含むものだけが保存されます。
誰もそれらのnull値を保持する方法を知っていますか?