文字列からパターンを抽出して抽出しようとしています。私は、テキスト文字列に次のように一致する任意のパターンを抽出する必要があります。テキスト文字列のパターンを検索し、一致パターンを抽出します
10289 20244
テキストファイル:
KBOS 032354Z 19012KT 10SM FEW060 SCT200 BKN320 24/17 A3009 RMK AO2 SLP187 CB DSNT NW T02440172 10289 20244 53009
私は、次のbashのコードを使用してこれを達成しようとしています:
バッシュコード:
cat text_file | grep -Eow '\s10[0-9].*\s' | head -n 4 | awk '{print $1}'
上記のコードは、10
で始まり、その後に3つの数字が続く約5つの数字のグループを検索します。このパターンにマッチした後、コードは残りのテキスト文字列を出力し、20
で始まる5つの数字の2番目のグループをキャプチャします。
現在のところ、このコードが失敗するため、これを達成するためにはより良い、より信頼できる方法が必要です。私が必要とする数値グループはスペースで区切られています。私は\s
をコードのgrep部分に挿入することによってこれを説明しようとしました。
これは '10289 12345 RMX 67890 FOO 20244 'にマッチするでしょう - それは望ましいですか? –