2016-05-10 11 views
0

私は単一のテーブルから1.5TBのデータベース抽出をしています。それは7つのファイルに分割され、RARで圧縮されました。awkでrarファイルを処理する

フィールドのサブセットを別のファイルに抽出して処理したいとしました。

例では、プロセスbzipまたはgzipファイルが見つかりました。私は何を求めているのですか?ファイルをawkで動作する形式に変換する方法が直接ない場合は?

CentOS6には〜146GBの作業スペースがあります。

+1

独自のフォーマットです。まず、お使いのOSで動作する抽出ソフトウェアが必要です。 'awk'はテキストファイルで動作します。 – karakfa

答えて

0

unrarを試してから、結果をawkに配管することができます。例えば

unrar p *.rar | awk '{print $NF}' 

またはより効率的に:あなたは最後のフィールドを必要とすると仮定してみましょう

find . -name *.rar | xargs -n 1 -P 4 unrar p | awk '{print $NF}' 

オプションpは "stdoutに印刷ファイル" を意味します。

こちらがお役に立てば幸いです。

関連する問題