同じ行に複数のregexpパターンを取り込む

-1

ここで私がしたいことがあります。私は複数の方法で区切られた行を持つファイルを持っており、それらの行のパターンに基づいて複数の部分文字列を取得したい。同じ行に複数のregexpパターンを取り込む

ですから、例えばラインは、このようなものになるだろう。つまり、私は、「サーバー名」をキャプチャする、「2017年08 07」、「SomeText1」と私の各行における「SomeText2」で

servername.domain:2017 08 07.SomeText1.otherIrrelevantStuff;SomeText2.MoreStuff 
^^^^^^^^^^  ^^^^^^^^^^ ^^^^^^^^^      ^^^^^^^^^

ファイル。

私はperl -Pでそれをやってみましたが、正の先読みや後ろ向きですが、最初のものだけが動作します。 1行あたりの結果も1行で出力する必要があります（複数のgrep -oPでパイプするのは受け入れられません）。

どうすればよいですか？

出典

2017-08-10 Arkandel

あなたの質問にそのサンプル入力の出力を追加してください。 – Cyrus

'awk -F '[。：;]' '{print $ 1、$ 3、$ 4、$ 6}'ファイル '？ – Cyrus

ファイルの1行あたりの出力は、次のようになります。 servername 2017 08 07 SomeText1 SomeText2 – Arkandel

のawkでは、matchに所望の正規表現を追加します。

$ awk ' 
BEGIN { OFS="," } 
{ 
    while(match($0,/servername|2017 08 07|SomeText1|SomeText2/)) { 
     b=b (b==""?"":OFS)substr($0,RSTART,RLENGTH) 
     $0=substr($0,RSTART+RLENGTH) 
    } 
    print b 
}' file 
servername,2017 08 07,SomeText1,SomeText2

出典

2017-08-10 19:42:08

あなたが:または;が満たされるまで、先に.の文字列を抽出したいようです。ロジックは、あなたが希望するものである場合は、それを行うためのPerlでgrep、

$ s="servername.domain:2017 08 07.SomeText1.otherIrrelevantStuff;SomeText2.MoreStuff" 

$ grep -oP '[0-9a-zA-Z\s]+(?=\.)' <<< "$s" 
servername 
2017 08 07 
SomeText1 
SomeText2

簡単な説明、

(?=\.)を使用することがあります。先にドットの
[0-9a-zA-Z\s]+言葉と一致します。grepだろうこの部分、0-9、AZ、az、またはスペースにマッチしたパターンを印刷します。

出典

2017-08-11 03:13:10 CWLiu

この場合grepの問題は、異なる行に出力を出力することです。出力は1行にする必要があります（例： servername 2017 08 07 SomeText1 SomeText2 – Arkandel

出力を 'tr -d 'にパイプライン化します\ n'' – CWLiu

同じ行に複数のregexpパターンを取り込む

答えて

関連する問題