2017-06-20 5 views
1

私はSparkとScalaの世界と交流しています。スプリット関数で省略されたヌルフィールド - Spark Scala

Iは、次のデータを含むファイルを有する:

1.1|AGDT970HH|02|2011|N||||| 
110000000000|0.00|0.00|0.00|1485976093.32| 
110100000000|0.00|0.00|0.00|248871036.86| 
110200000000|0.00|0.00|0.00|229610905.15| 
110201000000|0.00|0.00|0.00|256660759.36| 
110202000000|0.00|0.00|0.00|234105514.15| 
110203000000|0.00|0.00|0.00|-261155368.36| 
110300000000|0.00|0.00|0.00|280990.61| 

常にファイルの最初の行が他の行と比較して異なるレイアウトを有するであろうが。私はそれを別の治療を提供したいので、私は(ヌルものも含めて)最初の行の値を取得しようとする。そのため

val fileToRead = sc.textFile("FileName") 
val firstRow = fileToRead.first.split("\\|") 

しかし、私のfirstRowのフィールドが作成されますヌル値を含まない: enter image description here

値を含むものだけが保存されます。

誰もそれらのnull値を保持する方法を知っていますか?

答えて

1

val firstRow = fileToRead.first.split("\\|", -1)

関連する問題