mysql
からpyspark
にデータをインポートしようとしています。私はmysql
からpyspark
へのデータをデータフレームとして得ることができます。しかし、daylightsavings
時間のタイムスタンプ列のデータフレームに間違った時間が表示されます。mysqlからデータをインポート中
以下は、夏時間中にデータを取得したテーブルのデータです。
MySQLのデータ
id Package_time System_time PACKAGE GROUP
1 3/12/2017 2:19:51 AM 2017-03-11 18:13:43.577 TEST_1 STATUS
2 3/12/2017 2:19:53 AM 2017-03-11 18:13:43.577 TEST_1 ALARM
3 3/12/2017 2:19:53 AM 2017-03-11 18:13:43.577 TEST_1 ALARM
4 3/12/2017 2:19:53 AM 2017-03-11 18:13:43.577 TEST_1 ALARM
5 3/12/2017 2:19:54 AM 2017-03-11 18:13:44.611 TEST_1 STATUS
PySparkデータ
id Package_time System_time PACKAGE GROUP
1 3/12/2017 3:19:51 AM 2017-03-11 18:13:43.577 TEST_1 STATUS
2 3/12/2017 3:19:53 AM 2017-03-11 18:13:43.577 TEST_1 ALARM
3 3/12/2017 3:19:53 AM 2017-03-11 18:13:43.577 TEST_1 ALARM
4 3/12/2017 3:19:53 AM 2017-03-11 18:13:43.577 TEST_1 ALARM
5 3/12/2017 3:19:54 AM 2017-03-11 18:13:44.611 TEST_1 STATUS
私はpyspark
データフレームがmysql
テーブルと同じデータを持っていると思います。どのように私の結果を達成することができます。
データが同じであることを確認するために必要な変更は何ですか?列の
データ型:
id int
package_time timestamp
system_time timestamp
package string
group strimg
あなたの質問を編集して、あなたの時間列のデータ型を教えてください。 –
@ O.Jones質問にデータ型を追加しました。どうかしてください – User12345