私は、Amazon S3にあるavroファイルをZeppelinノートブックから読みたいと思っています。私はDatabricksがspark-avro
という素晴らしいパッケージを持っていることを理解しています。このjarファイルを自分のクラスタにブートストラップして動作させるために必要な手順は何ですか?Amazon EMRクラスタにspark-avrojarをブートストラップする
私は val df = sqlContext.read.avro("s3n://path_to_avro_files_in_one_bucket/")
、私のノートパソコンでこれを書くとき、私は以下のエラーを取得する - <console>:34: error: value avro is not a member of org.apache.spark.sql.DataFrameReader
私はthisを見てきました。私はそこに掲載された解決策は、最新のバージョンのAmazon EMRでは動作しないと思います。
誰かが私に指示を与えることができれば、それは本当に助けになるでしょう。