私はGCPのデータサイエンスでコードを実行しようとしており、Beamコードにエラーが発生しています。PythonのApache Beam、beam.io.TextFileSourceのエラー
これはエラーを与える行されます。 はAttributeError:: 'モジュール' をここで私が得ているエラーが beam.Read(beam.io.TextFileSource( 'airports.csv.gz')
ですオブジェクトは属性「TextFileSource」
を持っていないここで完全なファイルです:? https://github.com/GoogleCloudPlatform/data-science-on-gcp/blob/master/04_streaming/simulate/df01.py
誰もがこの作業を取得する方法を知っていますか、私が欠けている何が
ありがとう、Lak。私が使用しているデータフローのバージョンが新しいです: google-cloud-dataflow == 0.5.5 ドキュメントでTextFileSourceメソッドが見つからないため、SDKが変更されている可能性があります。私は.gzファイルを抽出し、ReadFromTextメソッドを使用してみましたが、他のエラーが発生しました。私はvirtualenvをチェックアウトし、それを実行しようとします。 – Geoff
私はgoogle-cloud-dataflow == 0.6.0とスクリプトdf03.pyも使用していません。新しいモジュールapache_beam.io.gcpを使用してコードをレビューするかどうか疑問に思っています –
申し訳ありませんが、 beam.io.ReadFromTextしかし、私はいくつかの場所を逃したようだ。私はdf03.py df04.pyとdf06.pyに変更を加えてチェックインしました。今は正しく動作するはずです。 – Lak