2016-04-27 16 views
0

私はhbase(v-1.2.1)にテーブルを持っており、その上にいくつかの機械学習技術を適用したいと思います。したがって、テーブルフォームhbaseをpandasデータフレームにロードしたいと思います。Hbase1.2.1 to pandas dataframe

hbase(main):006:0> list 
TABLE 
cust_sms                
1 row(s) in 0.0120 seconds 
=> ["cust_sms"] 
hbase(main):007:0> 

表名は「cust_sms」、hbaseのバージョンは1.2.1です。私はhbase 0.9.xバージョンでのみ動作するので、私はhappybaseを使用することができません。

`

答えて

-1

私はHBaseのにしてからパンダのデータフレームを読み書きするためのpythonパッケージを書いていました。私はいつかこのパッケージを使用していません。あなたはそれを試してみることができます。 github repoはhereです。 PyPiパッケージは、here

import happybase 
import numpy as np 
import pandas as pd 
import pdhbase as pdh 
connection = None 
try: 
    connection = happybase.Connection('127.0.0.1') 
    connection.open() 
    df = pdh.read_hbase(connection, 'sample_table', 'df_key', cf='cf') 
    print df 
finally: 
    if connection: 
     connection.close() 
です。