データフローとJavaをクラウドするのが初めてのので、これが正しい質問であると思っています。クラウドデータフローのETLと解析のCSVファイル
文字列、整数、タイムスタンプなどのn個の列と行を持つcsvファイルがあります。列ごとに新しいPCollectionを作成する必要がありますか?
私は例で見つけた文書のほとんどは、のようなもののラインに沿っている:
PCollection<String> data = p.apply(TextIO.Read.from("gs://abc/def.csv"));
しかし、私には、それは文字列として全体のCSVファイルをインポートしても意味がありません。私はここで何が欠けていますか?私は自分のPCコレクションをどうやってセットアップするべきですか?
が@jkffありがとう、私は今それを見てみましょう。 – chipoglesby
私はString [] parts = line.split( "、(?=([^ \"] * \ "[^ \"] * \ ")* [[^ \"] * $) –
予期しない列順のCSVを処理するためのより堅牢な方法はありますか? –