私は大(最大4GB)セミコロン区切りファイル(1.txt
)があります。バッシュソートCSV大きなファイルと出力ファイルを分離するためにソート
- "3321";"<a href='/files/goods/edit/647/'><u>[ID 647]</u></a> Шорты";"2015-09-06 18:39:17";"1590";"1";"500";"";"Лейла";"878785";"Да";"80.140.1.38"
- "2780";"<a href='/files/goods/edit/647/'><u>[ID 647]</u></a> Шорты";"2015-09-06 18:42:51";"1590";"1";"500";"";"Мара";"8664456";"Да";"46.00.00.2"
- "3352";"<a href='/files/goods/edit/698/'><u>[ID 698]</u></a> Deck";"2015-09-06 19:05:42";"990";"1";"400";"";"Ed";"456452";"Нет";"80.26.00.00"
- "3764";"<a href='/files/goods/edit/669/'><u>[ID 669]</u></a> Fish";"2015-09-06 18:36:18";"1390";"1";"530";"";"Ann";"545566";"Нет";"80.00.35.90"
- "3323";"<a href='/files/goods/edit/669/'><u>[ID 669]</u></a> Fish";"2015-09-06 18:54:18";"1390";"1";"530";"";"юрий";"99393";"Да";"85.141.00.100"
- "32763";"<a href='/files/goods/edit/430/'><u>[ID 430]</u></a> Radio";"2015-09-06
私は2番目の列と出力によってはファイルを分離するために、すべての結果でソート1.txt
必要が2番目の列名に。
sed -r -i -e 's#"<a href=\x27\/files\/goods\/edit\/##g' 1.txt | sed -r -i -e 's#\/\x27>#;#g' 1.txt | sort --field-separator=';' --key=2 1.txt
しかし、どのように今1.txt
ファイルを分割し、ファイルを分離して、ファイル内のレコードをカウントするために、すべて同じID(第2列)値のラインを入れて? 647_count.txt
のようにするには、698_count.txt
,669_count.txt
、430_count.txt
があります。
は、第二列 '「」'ではなく*数の最後のセクションが含まれている647_count.txt'ファイル名 'のように思えますファイル内のレコード* – RomanPerekhrest
647_count.txtには何も含まれていません。その方法を知らないので –
私は内容ではなくファイル名を意味しました。ファイル名に 'ID'値が含まれていますか? – RomanPerekhrest