0
私はSparkRを使用して、Rを含むいくつかのプロジェクトとそのテクノロジスタック内でのスパークを処理しています。関数値を含む列をSparkRでデータフレームをSparkに追加
私は、検証関数から返されたブール値で新しい列を作成する必要があります。私は長さの異なる2つのデータフレームを比較する必要があるときに問題がある
sdf1$result <- sdf1$value == sdf2$value
:私は次のようにスパークデータフレームと一つの式で簡単にこの仕事をすることができます。
sdf1
およびsdf2
のデータフレームを関数で操作し、値を新しい列sdf1
に割り当てる最も良い方法は何ですか?最小長がsdf1
〜sdf2
の列を生成するとします。
'sdf1 $ result < - sdf1 $ value == sdf2 $ value'のような論理演算は、長さの異なるベクトルに対しては無効です。あなたは何をしようとしていますか? –