0
HBASEプロジェクトから提供されたJAVA APIを使用して、HBASEからデータを読み書きできます。しかし、このようにして、読み取り操作はスパークドライバプログラムで処理されますが、それは巧妙な方法のようには見えません。パフォーマンスを向上させるために読書作業を別のワーカーで終了できるように、HBASEからデータを読み取る方法がありますか?JAVAでスパークしてHBASEからデータを読み書きする方法
HBASEプロジェクトから提供されたJAVA APIを使用して、HBASEからデータを読み書きできます。しかし、このようにして、読み取り操作はスパークドライバプログラムで処理されますが、それは巧妙な方法のようには見えません。パフォーマンスを向上させるために読書作業を別のワーカーで終了できるように、HBASEからデータを読み取る方法がありますか?JAVAでスパークしてHBASEからデータを読み書きする方法
Is there some spark way to read data from HBASE
はい
SQLContext
を使用してSparkでHBaseテーブルをロードすることは可能です。を読むために
スパークコードをjarファイル=============================
sqlContext.read.format("org.apache.phoenix.spark")
.option("table","HBase_table_name")
.option("zkUrl","Master_node_DNS_name:2181")
.load()
.registerTempTable("tempTblName")