spark.writeStreamの結果をハイブに保存するにはどうすればよいですか？

spark.readStreamを使用して、カフカからデータを読み込み、結果のデータフレームで爆発を実行しています。私はHiveテーブルに爆発の結果を保存しようとしていますが、私はその解決策を見つけることができません。 spark.writeStreamの結果をハイブに保存するにはどうすればよいですか？

  val query = tradelines.writeStream.outputMode("append") 
       .format("memory") 
       .option("truncate", "false") 
       .option("checkpointLocation", checkpointLocation) 
       .queryName("tl") 
       .start() 

      sc.sql("set hive.exec.dynamic.partition.mode=nonstrict;") 

      sc.sql("INSERT INTO TABLE default.tradelines PARTITION (dt) SELECT * FROM tl")

出典

2017-12-19 Divya

（それが実行されますが、私が作成した任意の新しいパーティションが表示されない）あなたがする必要があるファイルシステム

上dtのパーティションのチェックHDFSを私は次の方法を試してみましたが、それは動作しません。新しいパーティションを表示するには、ハイブテーブルのMSCK REPAIR TABLEを実行します。

Sparkで何か特別なことをしていないなら、Kafka Connect HDFSはKafkaからHiveパーティションを直接登録できることを指摘しておく価値があります。

出典

2017-12-19 19:56:54

spark.writeStreamの結果をハイブに保存するにはどうすればよいですか？

答えて

関連する問題