のMapReduce、HDFS入力、ハイブのテーブル出力

は、私は次の操作を実行するためのMapReduceジョブを書きたいと思います：のMapReduce、HDFS入力、ハイブのテーブル出力

上記のプロセスを毎日繰り返す。

質問：

2016-10-03 Ravi

あなたが望むことを行う方法以上のものがあります。はい、あなたはハイブですべてを行うことができます。 HiveにはHbaseにアクセスできるSerDesがいくつかありますので、これもハイブから使用できます。

あなたのMRジョブは、作業を行うマッパーによってのみ構成されています。とにかく、ハイブはそれを行うことができるので、私はMR仕事を書く良い考えではないと思います。おそらくMRジョブを構築するための速い方法は、ユーティリティー・ストリームを使用することです。マッパーは好きな言語で書くことができます。

ハイブまたは小さなMRジョブを使用している場合は、ジョブをoozieの下に置き、日常的に実行することができます。

2016-10-03 21:22:31 ozw1z5rd

ありがとうございました。私はHive/Hbaseテーブルにデータを挿入する前に、いくつかのデータ操作を実行する必要があります。 Hiveでデータ操作を行うことは可能ですか？あなたはユーティリティストリームによって何を意味しますか？ – Ravi

カスタムマッパーとレデューサーを使用してファイルをスキャンできるjarがあります。シンプルなマップレデューサージョブの作成を開始するには、簡単で良い方法です。 Googleのハープ・ストリーミング – ozw1z5rd

ありがとうございます。私はGoogleで検索します。私はHive/Hbaseテーブルにデータを挿入する前に、いくつかのデータ操作を実行する必要があります。 Hiveでデータ操作を行うことは可能ですか？この疑問に何らかの疑惑がありますか？ – Ravi

答えて