ローカルに保存したくないリモートファイルを処理するのにGNU Parallelを使用しようとしています。--round-robinを使ってGNUパラレル出力をstdoutに出力する
私のコマンドは多少のようになります。いくつかの入力ライン用
python list_files.py | \
parallel -j5 'aws s3 cp s3://s3-bucket/{} -' | \
parallel -j5 --round --pipe -l 5000 "python process_and_print.py"
process_and_print.py
プリント出力が、その出力は私が期待すぐのようにstdoutに取得していない、プロセスされた後の代わりに私が唯一の出力を参照してください終了しました。 --round
パラメータを削除すると、すべて正常に動作します。
すべてのデータは保存されますか?バッファリングせずに、行単位で標準出力に出力する方法がありますか?