0
ハイブから2つのテーブルをデータフレームに読み込み、両方のデータフレームに存在する行に一意の番号を関連付ける必要があります。この数は、データフレーム内で、また両方のデータフレーム内で一意でなければなりません。SparkのDataFrameの各行の乱数
ハイブからの照会中にrow_source()
機能の使用について読みましたが、その番号は2つのデータフレームで一意ではありません。
解決策をご提案ください。あなたが行うことができます
私はいくつかのフィールドにその値を使用したいと思いますが、それはどんなジャンク値でもかまいません。 –
あなたができることは、UUID.randomUUID.hashCode.toLongまたはUUID.randomUUID.hashCode.toIntを使用することができます –
それはあなたの問題を解決する? –