Google Cloud Dataflowの使い方は非常に新しいです。私は2つのPCコレクションのデカルト積を得たいと思います。たとえば、2つのPCコレクションが(1, 2)
と("hello", "world")
の場合、デカルト積は((1, "hello"), (1, "world"), (2, "hello"), (2, "world"))
です。2つのPCコレクションのデカルト積を取得するには
どのようにすればよいのでしょうか?また、デカルト積が大きくなる可能性があるので、私はこのソリューションが遅れて製品を作成し、メモリの消費を避けることを望んでいます。
ありがとうございます!
あなたは何をしようとしているかについて詳しくはありますか?それぞれのPCコレクションの大きさはどれくらいですか?これを達成するにはいくつかの方法がありますが、デカルト積と実際のPCollectionを必要とする理由によって、どちらが良いかが決まります。 –
2つのPCollectionは同じです。それらはどちらも '(String、String)'型の約10万のタプルを含んでいます。私は英語の単語の辞書を使用しており、「fantasti-CAL-ifornia」のように2単語の言葉遣いを生成するために表音文字列を得ています。 –
直接的なデカルト解については、[this](http://stackoverflow.com/a/41051283/377366)が現在利用可能な最良の答えのようです。 – KobeJohn