HBASEは、行の代わりに列ごとにHDFSにテーブルの構造化データを格納する列データベースです。私はSparkがHDFSから読み書きできることを知っています。また、Spark用のいくつかのHBASEコネクタがあり、現在はHBASEテーブルを読み書きできるようになっています。HBFSとSparkとHDFSのスパーク
質問:
1)の代わりに、単にHBaseのを使用するのではHBaseの上に火花を積層することによってもたらした追加機能は何ですか?それはプログラマーの能力にのみ依存するか、それを実行するパフォーマンスの理由がありますか?スパークができることはありますか、HBASEだけではできないことはありますか?
2)直接HDFSを使用するのではなく、HDFSとSPARKの間にHBASEを追加する必要がある場合は、前の質問からステミングしてください。
? –
チェリー - 大量のバッチ処理を行う代わりに特定のレコードを選択 – Johan
どういう意味ですか?あなたは..を選んだ? –