私はさまざまなリスト要素を持つ何百ものテキストファイルを持っています(千単位)。簡略化された3つの代表的なファイルが以下に示されています(ここでは行の要素は色です)コンティンジェンシーテーブルを作成する
group1.txt
red
blue
red
green
pink
red
group2.txt
yellow
brown
cyan
yellow
brown
red
violet
orange
group3.txt
orange
violet
pink
cyan
grey
は、私は以下のスクリプトでソートカウントテーブルを作成することができます -
awk -F '\t' '{print $1}' * | sort | uniq -c | sort -nr
>
4 red
2 yellow
2 violet
2 pink
2 orange
2 cyan
2 brown
1 grey
1 green
1 blue
私は次のように分割表を作成したい -
Colour group1 group2 group3
red 3 1 0
green 1 0 0
blue 0 0 0
yellow 0 2 0
orange 0 1 1
grey 0 0 1
violet 0 1 1
pink 1 0 1
brown 0 2
cyan 0 1 1
にはどうすればいいのawk、パイソン、PerlやRを使用して、この分割表を作成することができますか?
あなたはファイル数として数3は一例であり、あなたが持っていることを含まなければなりません多くのファイルを処理します。 – simbabque