pyspark.sql.functions.from_utc_timestamp(timestamp, tz)
をインポートしようとしましたが、無効な構文エラーが常に表示されます。このモジュールを使用して、エポックタイムの値のセットをsparkのUTCに変換するにはどうすればよいですか?あなたがやりたいpyspark.sql.functions.from_utc_timestamp(timestamp、tz)の構文エラー
答えて
いくつかのサンプルコード(ドキュメントから取られ、および修正):
>>> from pyspark.sql.functions import from_utc_timestamp
>>> df = sqlContext.createDataFrame([('1997-02-28 10:30:00',)], ['t'])
>>> df.select(from_utc_timestamp(df.t, "PST").alias('t')).collect()
[Row(t=datetime.datetime(1997, 2, 28, 2, 30))]
ありがとう!それはうまくいった。しかし、今は私の行にエラーが表示されます:df = sqlContext.createDataFrame(logLine、['t']) TypeError:型の型を推測できません: 'unicode'型 私のファイルにはエポック時間の5つの値しか含まれていません。 – kaks
logLineはどのようなタイプですか?それはUTCタイムスタンプのタプルの配列ですか?これは '[Tuple_of_column_1、Tuple_of_column_2、...]'の形式でなければなりません。 'Tuple_of_column_1'は'( '1994-05-18 12:30:00'、 '1997-02-28 10:30:00 '、' 2007-05-02 1:30:00 '、...) '。 既にテキストファイルである場合は、 'sc.textFile'を使用することができます。 このトピックに関係のない質問については、新しいSOの質問を開くことをお勧めします – AbdealiJK
- 1. Windows:Rufus: `ENV ['TZ'] = 'Continent/City'エラー
- 2. 構文解析エラー:構文エラー
- 3. 角度エラー:$構文解析:構文構文エラー
- 4. NodaTimeアップデートマニュアルtz db
- 5. 構文解析エラー:echo文の構文エラー
- 6. エラーC2059:構文エラー: '。'
- 7. エラーA2008:構文エラー:
- 8. エラーC2146:構文エラー
- 9. SQLDFエラー - 構文エラー
- 10. ノードJS構文エラーのMySQL構文
- 11. タイムスタンプとTZ名のTZ略語を取得
- 12. PSQLException:エラー:tsqueryの構文エラー
- 13. エラー1064:SQLの構文エラー
- 14. SQLiteのエラー:構文エラー
- 15. Groovy SQL文の構文エラー
- 16. INSERT INTO文の構文エラー
- 17. UPDATE文の構文エラー
- 18. 印刷文の構文エラー
- 19. SQL文の構文エラー
- 20. else文の構文エラー
- 21. PDO SQL文の構文エラー
- 22. OleDbException:INSERT INTO文の構文エラー
- 23. Swtich文の構文エラー
- 24. INSERT INTO文の構文エラー
- 25. 文の構文がエラー
- 26. 構文エラーのDateTime
- 27. Matlabの構文エラー[〜、...]
- 28. サブクエリの構文エラー
- 29. SQL構文のエラー
- 30. ストアドプロシージャの構文エラー
は、あなたがしようとしたコードに手の込んだてもらえますか? 'pyspark.sql.functions.from_utc_timestamp(timestamp、tz)'をインポートして、関数呼び出しであり、無効なpython(構文エラー) – AbdealiJK
ああ!次に、私はインポートpyspark.sql.functions.from_utc_timestamp(タイムスタンプ、tz)を試してみました。私は質問に追加のコードを追加しました。 – kaks
私は関数をインポートする適切なコードを持つpysparkドキュメントからいくつかのコードで答えました – AbdealiJK