Spark SQLを使用してHiveテーブルの静的パーティションにデータを挿入する方法を理解することができません。Spark SQLを使用して静的ハイブパーティションにデータを挿入
df.write.partitionBy("key").insertInto("my_table")
しかし、私は静的パーティションにデータを挿入する方法を見つけることができません。つまり、DataFrameに列を追加することなく、DataFrame全体を書き込む必要があるパーティションを定義したいと考えています。
InsertIntoHiveTableクラスに記載されているスタティックパーティショニングを参照してください。サポートされていると思います。私がしたいことをするための公開APIはありますか?
あなたがに似た任意のAPIを見つけることができましたダイナミックパーティションに書き込む? – Explorer
いいえ、何も見つかりませんでした。一時テーブルとしてRRDを登録し、SQL INSERTを実行しました。しかし、Hiveコードの多くはSpark 2.0で書き直されているので、今では可能かもしれません。 –