GNU page of GAWKから、FPAT
変数を使用してデータの区切り文字を処理できることがわかりましたが、これはどのように機能するのですか? CSVはFPAT値を提出するためには、次のとおりです。awk FPAT変数:作業
FPAT = "([^,]+)|(\"[^\"]+\")"
:最初のグループ化された式はすなわちすべてではないコンマと評価さ
abc,"pqr,mno"
データが最初で失敗するように、これはを取る必要がありますカンマの出現。今私の質問は次に起こることですか?最初のグループ化された式が失敗したので、正規表現は、または条件を使用してカンマの後の文字から継続しますか?最初のグループ化された式は、コンマの後のすべてのデータに対して有効なままなので、次のデータとして"pqr
がかかる可能性がありますか?
私の質問は、データがカンマではないため、常に「^」に行くことができるという点で、2番目のパターンから始まるでしょうか?regexpは貪欲であるため、最初の一致を探します。 – ghub24
sudo_Oさん、ありがとうございます。 – ghub24
@ user1844303これは最長の時間になります。簡単なテストは、2つの正規表現の順序を切り替えることです。 –