1
SpaseストリームコードでHBaseデータを読み込み、ストリーミングデータをさらに強化したいと考えています。私はspark-hbase-connector_2.10-1.0.3.jar
を使用しています。私のコードでScalaのHBaseを読む - it.nerdammer
次の行には、右の数を返しますdocRdd.count
成功
val docRdd =
sc.hbaseTable[(Option[String], Option[String])]("hbase_customer_profile")
.select("id","gender").inColumnFamily("data")
です。
docRdd
はタイプ
です
id, gender
列のすべての行を読み込むにはどうすればよいですか。また、docRdd
をデータフレームに変換して、SparkSQLを使用することもできます。私は、行キーを追加した
case class Customer(rowKey: String, id: Option[String], gender: Option[String])
:
ありがとう@ベリリウム。私はこれを試してみる。私はSparkStreamでRDDを使いたいです。私はそれが同様にシリアライズ可能であることを望む。おかげさまでもう一度お返事ありがとうございます –
この質問にはもう助けが必要ですか? – Beryllium
私はこのすべてに設定されています。ありがとうございました.. –