.CoGroupByKeyに入力するために必要なpCollectionsにpCollectionsを変換する方法についてのマニュアルがないが(ありません)テーブル行のPCollectionをPythonのkey、value PCollectionsに変換するにはどうすればよいですか?
コンテキスト 基本的に私は2つの大きなpCollectionsを持っていると私はタイプIIのために、両者の違いを見つけることができるようにする必要がありますETLが変更された場合(pColl1に存在しない場合はpColl2のネストされたフィールドに追加)、BigQueryからこれらのレコードの履歴を保持できるようになります。
パイプラインアーキテクチャ:dwskuと製品:
- 読むBQ表2 pCollectionsに。
- 返される2つのセットにCoGroupByKey()を適用します。 - >結果
- dwsku内のすべての変更を見つけてネストして製品に入れます。
何か助けが必要です。私は達成するのに必要なものと同じことを行うので、Python SDKには何もありません。
Convert from PCollection<TableRow> to PCollection<KV<K,V>>
Apacheのビーム、特にPythonのSDKのドキュメント/サポートはありますか?