2016-11-10 12 views
0

私は2つのクラスタを紺色に、1つは火花2.0に、もう1つはhbaseにします。私はhbaseを完全に埋めて使用することができます。今度はhbaseにスパークを接続して計算を行いたいと思います。私はスカラを知らないので、Pythonを使用したいと思います。pysparkからhbaseに接続する方法

私の最初の質問は:それを行うには、最善の方法は何ですか? spark - > hive - > hbaseまたはhbaseに直接触れる?

私は挿入とクエリの良い例がありますか?

ありがとうございます。

+1

ハイブをやりたい理由がわかりません。 Spark Hbase Connectorに間違いがありますか? –

+0

何も問題ありません。私の問題は、良い例を持つPython用のコネクタが見つからないということです。たぶん私はグッドグーグルグーグルではない –

+0

ええ、私はスカラーの例を見つけただけです。しかし、hbaseのpythonライブラリがありますので、私はあなたには並列処理のためのスパークが必要だと仮定しています。 –

答えて

関連する問題