私たちのプロジェクトにはscalaとpythonのコードがあり、avroでエンコードされたメッセージをkafkaに送る/消費する必要があります。 私はavroのコードをpythonとscalaを使ってkafkaに送信しています。私は次のようにTwitterの全単射ライブラリを使用してアブロエンコードされたメッセージを送信Scalaのコードでプロデューサーを持っている: val resourcesP
私はpysparkでavroファイルを読み込もうとしています。 How to read Avro file in PySparkから、spark-avroがこれを実行する最善の方法であることがわかりましたが、そのインストール方法はわかりませんGithub repo。ダウンロード可能なjarファイルはありません。自分で作成できますか?どうやって? クラスタ上で動作するIt's Spark 1.6(p
こんにちはを使用して複数の出力ディレクトリにアブロ書くために、MultipleTextOutputFormat Write to multiple outputs by key Spark - one Spark job を使用して1つのスパークジョブで複数の出力ディレクトリにテキストデータを書き込みに関するトピックがありますどのように私が求めるだろう私が欲しいもの、複数のディレクトリ にアブロデ