私は受け付けておりカフカを使用して処理するHBaseのためにデータフレームをストリーミングこの火花を送信:このように見えるのデータフレームを作成するために、私のデータをスパークストリーミングでScalaの
+---+-------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------+
|id |sen |attributes |
+---+-------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------+
|1 |Stanford is good college.|[[Stanford,ORGANIZATION,NNP], [is,O,VBZ], [good,O,JJ], [college,O,NN], [.,O,.], [Stanford,ORGANIZATION,NNP], [is,O,VBZ], [good,O,JJ], [college,O,NN], [.,O,.]]|
+---+-------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------+
私は、列のidとATTとHBaseのテーブル「kafkaStreaming」を持っています。私はこのデータをhbaseに "ID"を行キーとして保存し、att [例:Stanford、ORGANIZATION、NNP]、[is、O、VBZ]、[good、O、JJ]
このデータが来るたびに、列ファミリを動的に追加する必要があります。助けてください。
PUTオブジェクトに変換してHBASEに注入する方法を知りたい –