0
私はApache MapReduceを使って生データを解析し、データベースにロードします。Mapperの出力キーの左端2桁でレデューサーを実行
My Mapperは、テキストファイルから生データ行を解析します。各行には固有の数値ID(キー)とキーと値のペア(値)の集合が割り当てられます。
My Reducerは、各行IDごとに、データベースのキーと値のペアを保存します。私は、任意の減速がそのIDに実行したくない、その後減速が10で始まるIDを処理するように、11、12など -
私は 左端の2桁てラインIDグループにしたい11で始まるIDSを処理するすべてのレデューサーが終了する前に、12で始まります。
Apache MapReduceを使用して実装できますか?
ありがとうございます!
これは可能なように私には聞こえません。なぜあなたはこれをしたいのですか? –