0
レコード(行)ごとにタイムスタンプを持つcsvファイルがあります。私はspark csv(私はそれをSpark 1.5.2に含めています)を使って解析していますが、奇妙なことが起こります。csvファイルの解析時に時間が移動しました
私のファイルのタイムスタンプはすべて3時間ずれています。たとえば、2015-12-27 00:00:00
から始まり、2016-12-28 00:00:00
で終わる値があります。今、Sparkを使ってこれを解析すると、範囲2015-12-27 03:00:00
から2015-12-28 03:00:00
までの値が得られます。
なぜこれが起こっていますか、それを処理する最良の方法は何ですか?