私は2つのDStreamを持っています。 A:DStream[X]
とB:DStream[Y]
としましょう。ScalaでSpark Streamingで2つのDStreamのデカルト積を得るには?
が、私は他の言葉で、それらのデカルト積を取得したい、X
とY
値のすべてのペアを含む新しいC:DStream[(X, Y)]
。
RDDにはcartesian
機能があります。私はthis similar questionしか見つけることができませんでしたが、それはJavaであり、私の質問には答えません。
です。 'A:DStream [(String、Int)]'は、それぞれに関連付けられた計算値を持つ用語の集合です。 'B:DStream [Int]'は 'count'関数の結果です。したがって、整数値は1つだけです。 Aからの整数値とBからの整数値を使って何かを計算したいと思います。 AとBのデカルト積を得ることによって、Aの各レコードにBの値を加えた新しいDStreamを取得します。私の結果を地図で計算することができます。 注文は関係ありません。 私はSparkとScalaの非常に新しいユーザーです。私が間違っていれば、より良い方法を教えてください。 – Coukaratcha