-2
私は、02:00:30のような記録時間を含むrddの構造を持っています。 私はこのフォーマットから2番目のフォーマットにデータを変換したい、私はこのtreatementをしたい:02 * 3600 + 00 * 60 + 30 誰かがpysparkでこの治療をするのを助けてくれる?前もって感謝します。pysparkによる数学的操作
私は、02:00:30のような記録時間を含むrddの構造を持っています。 私はこのフォーマットから2番目のフォーマットにデータを変換したい、私はこのtreatementをしたい:02 * 3600 + 00 * 60 + 30 誰かがpysparkでこの治療をするのを助けてくれる?前もって感謝します。pysparkによる数学的操作
マップそれ
rdd=rdd.map(lambda row: [3600*int(row[0].split(':')[0])+60*int(row[0].split(':')[1])+*int(row[0].split(':')[2]))
はSOへようこそ。このリンクを最初にチェックしてくださいhttp://stackoverflow.com/help/how-to-ask –