私たちは、ハイブテーブルに顧客データを持ち、TBのデータを持つ別のハイブテーブルに販売データを持っています。複数の顧客の販売データを引き出し、ファイルに保存しようとしています。我々はこれまでに試した何同じデータフレーム内に複数のデータを挿入
:
我々は左外側と疲れは、顧客と販売テーブル間の結合が、理由はそれが動作していない巨大な販売データの。
val data = customer.join(sales,"customer.id" = "sales.customerID",leftouter)
ので代替が特定の顧客領域リストに基づいて、データ形式売上テーブルを引くと、データが他のデータフレームで保存存在すると同じにデータをロードする場合、この領域データは、顧客データを持っているかどうかを確認することですすべての地域のデータフレーム。
私の質問は、データフレームのデータの複数の挿入がsparkでサポートされているかどうかです。
OK、あなたは私の編集を参照してください@venkataデータフレーム – venkata
に複数の挿入にコメントすることができます:あなたは、あなたが
reduce
と一緒union
を使用することができ、相互にマージするデータフレームのリストを持っている場合にはあなたの質問に答えるべきだと思います。 – Shaido