かなり大きなファイル(1億5000万行の10文字)があります。私は200万行の150ファイルに分割する必要があり、各出力行はソース行の最初の5文字または最後の5文字です。 私はPerlでこれをやや早く行うことができましたが、bashを使って簡単に解決できるかどうか疑問に思っていました。 アイデアLinux/bashでファイルとその行を分割する
1
A
答えて
3
宿題? :-)
sed(各行を2つに分割する)とsplit(複数のファイルに分割する)という単純なパイプで十分だと思います。
manコマンドはあなたの友人です。
どの程度
sed 's/\(.....\)\(.....\)/\1\n\2/' input_file | split -l 2000000 - out-prefix-
:それは宿題ではないことを確認した後に追加されました
?
0
は、私はこのような何かが仕事ができると思う:それはしかし、単純またはPerlを使用するよりも効率的かどう
out_file=1
out_pairs=0
cat $in_file | while read line; do
if [ $out_pairs -gt 1000000 ]; then
out_file=$(($out_file + 1))
out_pairs=0
fi
echo "${line%?????}" >> out${out_file}
echo "${line#?????}" >> out${out_file}
out_pairs=$(($out_pairs + 1))
done
わかりません。
0
X.TXTと呼ばれるその大きなファイルを想定して、それが名前のX.TXTと、現在のディレクトリ内のファイルを作成するにはOKだと仮定すると、各ラインのバリアントの最初の5つの文字は、*:。
は-l 2000000 Xを分割.txt x.txt.out & &(x.txt.out *の分割ファイル用); outfile = "$ {splitfile} .firstfive"; echo "$ splitfile-> $ outfile"; cut -c 1-5 "$ splitfile ">" $ outfile "; done)
関連する問題
- 1. 行をそのコンポーネントに分割する
- 2. Hadoop - ファイルを行数で分割する
- 3. ファイルを行と分割テキストで解析する方法
- 4. AWSラムダPython分割ファイルを小さなファイルに分割すると、無限ループで実行される
- 5. 分割ファイルの分割
- 6. 分割dmpファイルを複数のdmpファイルに分割する
- 7. 空白行のX行の後にファイルを分割する
- 8. Perlファイルを行と変数に分割する
- 9. mp4ファイルとmp4ダッシュを分割する
- 10. .csvファイル内の行をPythonで分割する
- 11. ファイルから行を読み込んでPythonで分割する
- 12. イメージを行と列に分割する
- 13. ファイルを分割する
- 14. TIFFファイルを分割する
- 15. ruby on railsファイルを分割するindex.jsを分割する
- 16. テンプレートをマクロと一緒にファイルに分割するブックを分割する
- 17. csvファイルを読み込んで行列を分割する
- 18. 分割テキストファイルの行と列
- 19. 別のファイルの内容と行ごとにsedの亜分割
- 20. QFile:ファイルを部分に分割する
- 21. csvファイルを行単位で分割して再編成する
- 22. Hive - ファイル間でデータを分割する
- 23. ファイルをJavascriptでチャンクに分割する
- 24. 競合マーカーでファイルを分割する
- 25. ファイル名をPythonで分割する
- 26. Matlabでwavファイルを分割する
- 27. Python:タブでtxtファイルを分割する
- 28. CSVファイルを2列で分割する
- 29. Pythonでファイルを分割する方法
- 30. ファイルをバイト数で分割する
私は、変換が正確であることを少しはっきりさせる必要があると思います。 (つまり、私はそれを取得しません)おそらく小さな例ですか? – mweerden