2017-06-28 7 views
-2

を合計し、私は次の行を含むファイルを持っている:集計行と列

01323874;291874;-;000000000000003030;2511011999;-;000000000000000000 
01323874;291874;-;000000000012920840;2511011999;+;000002910023874000 
01323872;291872;-;000000000000008750;2511011999;-;000000000000008750 
01323872;291872;+;000000000609396980;   ;+;000000000000000000 
01323778;  ;-;000000000468442930;   ;+;000000000000000000 
01323778;  ;+;000000005166500460;   ;+;000000000000000000 
01323778;  ;-;000000000469421100;2511021000;+;000000000469421100 
01323778;291778;-;000000000361156930;2511021000;-;000000000361156930 
01323778;  ;-;000000000186088530;2511021000;+;000000000186088530 
01323778;291778;-;000000000017602470;2511021000;-;000000000017602470 

私は最初の列に基づいて行を集計したいと思います:

サムアップ列の値列3の符号(+/-)を考慮して、列4の符号(+/-)を考慮して計算する。

列6の符号(+/-)を考慮して合計値を計算する。

01323874;291874;-;000000000012923871;2511011999;+;000002910023874000 
01323872;291872;+;000000000609388230;2511011999;-;000000000000008750 
01323778;291778;+;000000003663788500;2511021000;+;000000000276750230 

私はよくフォーマットされたラインを生成することに成功したが、非常に理解されるであろうthem.your助けを集約する方法を見つけることができませんでした。

+1

そして、あなたがこれまでに試してみましたを返すかどうかを定義? – sjsam

+0

最初にここにコードを投稿してください。 –

+1

列2と列5はどうですか? –

答えて

4
kent$ cat f 
01323874;291874;-;000000000000003030;2511011999;-;000000000000000000 
01323874;291874;-;000000000012920840;2511011999;+;000002910023874000 
01323872;291872;-;000000000000008750;2511011999;-;000000000000008750 
01323872;291872;+;000000000609396980;   ;+;000000000000000000 
01323778;  ;-;000000000468442930;   ;+;000000000000000000 
01323778;  ;+;000000005166500460;   ;+;000000000000000000 
01323778;  ;-;000000000469421100;2511021000;+;000000000469421100 
01323778;291778;-;000000000361156930;2511021000;-;000000000361156930 
01323778;  ;-;000000000186088530;2511021000;+;000000000186088530 
01323778;291778;-;000000000017602470;2511021000;-;000000000017602470 

出力

kent$ awk -F';' '{a[$1]=(1*$2?$2:a[$1]); b[$1]+=$3=="-"?-$4:$4; 
        c[$1]=(1*$5?$5:c[$1]); d[$1]+=$6=="-"?-$7:$7} 
     END{for(x in a) 
       printf "%s;%s;%s;%018d;%s;%s;%018d\n", 
         x,a[x], 
         (b[x]>0?"+":"-"),(b[x]<0?-b[x]:b[x]),c[x], 
         (d[x]>0?"+":"-"),(d[x]<0?-d[x]:d[x])}' f 
01323872;291872;+;000000000609388230;2511011999;-;000000000000008750 
01323778;291778;+;000000003663788500;2511021000;+;000000000276750230 
01323874;291874;-;000000000012923870;2511011999;+;000002910023874000 
+0

私の個人的な知識のために、そこに '1 *'の目的は何ですか? – fzd

+1

@fzdコードから削除するかどうかがわかります。それは黒ではあるが空でない文字列をフィルタリングした。 '' '' – Kent

+0

@kentのようにうまくいきますが、2列目または5列目に空白が含まれている場合は、大文字と小文字を区別しません。例えば、01323872; 291872; +; 000000000609388230 ;; - ; 000000000000008750'ですが、これは '01323872; 291872; +; 000000000609388230です。 BLANK SPACE; - ; 000000000000008750' – technopathe

0

AWK溶液:

awk -F';' 'function get_sign(n){ 
       return (n<0)? "-":"+" 
      } 
      { 
       a[$1]+=int($3$4); b[$1]+=int($6$7); 
       if ($2*1) fld2[$1]=$2; if ($5*1) fld5[$1]=$5 
      } 
      END{ 
       for(i in a) print i, fld2[i], get_sign(a[i]), 
       sprintf("%018d",(a[i]>0)? a[i]:a[i]*-1), fld5[i], get_sign(b[i]), 
       sprintf("%018d",(b[i]>0)? b[i]:b[i]*-1) 
      }' OFS=';' file 

出力:

01323872;291872;+;000000000609388230;2511011999;-;000000000000008750 
01323778;291778;+;000000003663788500;2511021000;+;000000000276750230 
01323874;291874;-;000000000012923870;2511011999;+;000002910023874000 

  • function get_sign(n) { ... } - 機能、数値引数nが正または負であると、それぞれの記号
+0

それはうまく動作しますが、列2または5に空白だけが含まれている場合には、ケースを引き渡しません。例えば、01323872; 291872; +; 000000000609388230 ;; - ; 000000000000008750'ですが、これは '01323872; 291872; +; 000000000609388230です。空きスペース; - ; 000000000000008750' – technopathe

+0

@technopathe、それは真実ではありません。私は、2番目の列に空白だけが含まれていて、それが私に気付いたときに、そのケースをテストしました: '01323872 ;; +; 000000000609388230; 2511011999; - ; 000000000000008750 01323778 ;; +; 000000003663788500; 2511021000; +; 000000000276750230 01323874 ;; - ; 000000000012923870; 2511011999; +; 000002910023874000 '期待どおり – RomanPerekhrest

+0

実際、私はむしろこのように白いスペースを印刷しています; *********;この方法より; *は空白を指します – technopathe