2016-05-25 7 views
0

私はマップはここに見つかったデータによってソート仕事を減らすことがあります。 http://archive.ics.uci.edu/ml/datasets/Bank+MarketingMapreduce:Lexicographical ordering。テキストとのInt型の

私は現在、ファイルを介して並べ替え、次の形式のキーと値のペアを出力仕事をしている: 教育の種類を、銀行残高、雇用、婚姻状況、ローン承認。

これは完璧に近いです。同じ人物が複数いる場合は、その隣に数字が表示されたリストが表示されます。

私がやりたいことは、複数のジョブを実行したり出力順序を変更せずにリストの順序を編集することです。

出力の例は次のとおりです。

unknown, 970, unemployed, married, yes 1 
unknown, 9716, housemaid, married, no 1 
unknown, 973, services, divorced, no 1 
unknown, 973, services, divorced, yes 2 
unknown, 974, services, single, no 1 
unknown, 975, entrepreneur, married, no 1 
unknown, 975, technician, divorced, no 1 
unknown, 976, bluecollar, married, no 1 
unknown, 98, admin, married, no 1 

出力はソート(この場合は不明で)教育の種類によって、私は彼らがバランスを降順になるように、出力内の順序を変更したいんが辞書順にソートされていません。 EG:

unknown, 98, admin, married, no 1 
unknown, 970, unemployed, married, yes 1 
unknown, 973, services, divorced, no 1 
unknown, 973, services, divorced, yes 2 
unknown, 974, services, single, no 1 
unknown, 975, entrepreneur, married, no 1 
unknown, 975, technician, divorced, no 1 
unknown, 976, bluecollar, married, no 1 
unknown, 9716, housemaid, married, no 1 

次の質問は、私がintwritableような何かにキータイプを変更する必要がありますが、私はすでに最初のテキスト値でソートしていますように私はこれを行うことはできませんと言います。 How to override the default sorting of Hadoop

TLDR:複数のジョブを実行して、キー内で2つの別々の変数タイプを並べ替える必要がありますか?

答えて

関連する問題