私は、別のサーバ上にあるHBaseテーブルからデータを取得するスパークジョブ(Scalaで書かれています)を持っています。これを行うには、まずHBaseContext
を次のように作成します。 val hBaseContext:HBaseContext = new HBaseContext(sparkContext, HBaseConfiguration.create())
spbase-submitするhbase-site.xmlを指定してください
私はspark-submitを使用して、必要な引数を指定します。このような何かを:
spark-submit --master=local[*] --executor-memory 4g --executor-cores 2 --num-executors 2 --jars $(for x in `ls -1 ~/spark_libs/*.jar`; do readlink -f $x; done | paste -s | sed -e 's/\t/,/g') --class com.sparksJob.MyMainClass myJarFile.jar "[email protected]"
事しかし、私はそれが別のサーバー上の飼育係(HBaseのは1)に接続したい、これはローカルホスト上のZooKeeperに接続ということです。しかし
val configuration: Configuration = new Configuration()
configuration.set("hbase.zookeeper.quorum", "10.190.144.8")
configuration.set("hbase.zookeeper.property.clientPort", "2181")
val hBaseContext:HBaseContext = new HBaseContext(sparkContext, HBaseConfiguration.create(configuration))
を私はそれは、設定したい:この情報をハードコーディング
で動作します。
使用するhbase-site.xmlファイルへのパスをspark-submitに指定するにはどうすればよいですか?
zookeeperクォーラムとスカラのアプリケーション引数を介して移植できますか? – maxteneff
JARファイルからHBaseContextを取得しましたが、Ted Malaska git repoとは離れていました。このクラスは見つかりませんでした.SBTファイルまたはPOMファイルを共有できるようになりますか?https:// github .com/tmalaska/SparkOnHBase – Manjesh