2017-01-19 20 views
0

レコード(行)ごとにタイムスタンプを持つcsvファイルがあります。私はspark csv(私はそれをSpark 1.5.2に含めています)を使って解析していますが、奇妙なことが起こります。csvファイルの解析時に時間が移動しました

私のファイルのタイムスタンプはすべて3時間ずれています。たとえば、2015-12-27 00:00:00から始まり、2016-12-28 00:00:00で終わる値があります。今、Sparkを使ってこれを解析すると、範囲2015-12-27 03:00:00から2015-12-28 03:00:00までの値が得られます。

なぜこれが起こっていますか、それを処理する最良の方法は何ですか?

答えて

0

問題は、サーバー上のタイムゾーンがUTCと異なることです。それは構文解析を混乱させ、解析中に3時間を追加しました。

関連する問題