google-dataflow-sdkを使用してGoogleクラウドストレージにCSVファイルをアップロードしています。 Googleのクラウドプロジェクトにファイルをアップロードすると、データはクラウド上のランダムな順序でファイルに表示されます。 csvの各行は正しいですが、行はすべての場所にあります。Googleのクラウドストレージにアップロードすると出力データがランダムに表示される
csv)のヘッダーです。アトリビュート、アトリビュート、アトリビュート)は常に別の行にあります。私はもう一度ストレスを感じ、各列のデータは問題なく、ランダムに配置された行だけです。ここ
は、最初にデータを読み込むコードです:
PCollection<String> csvData = pipeline.apply(TextIO.Read.named("ReadItems")
.from(filename));
、これはGoogleのクラウドプロジェクトに書き込むコードです:任意の助け
csvData.apply(TextIO.Write.named("WriteToCloud")
.to("gs://dbm-poc/"+partnerId+"/"+dateOfReport+modifiedFileName)
.withSuffix(".csv"));
感謝。まず
データフローを使用しないようにしました。 –
はい、私はそれに対して反対を決めました。より簡単な代替案があることがわかりました – Zanny
OK、あなたの質問を編集する必要があります。 –