特定のIDを含む特定の行の単語数をカウントします(たとえば、* AUY)。これまでのところ、私はラインを見つけるために、以下の正規表現を使用して試してみましたが、それは特定の単語で始まる行の単語数をカウントします。
*AUY: today is holiday so Peter and Mary do not need to go to work .
%mor: n|today cop|be&3s n|holiday conj|so n:prop|Peter conj|and n:prop|Mary v|do neg|not v|need inf|to v|go prep|to n|work .
%snd: <00:00:00><00:07:37>
%AUY: ok_pfp (0.40) er today is holiday errfr ::: so er Peter and Mary {is} ~ er do not need errfr ::: to go to work . errfr :;:a |
結果は最初でなければなりません、私はテスト文字列の下に持って
^ *(.*\b(?:\\*AUY)\b.*) *$
開始時に「*」を考慮していません結果の一致の最初と最後の文字列を返します。これはRubular
質問をより明確にすることはできますか?あなたが提供したテスト文字列から何を抽出しようとしていますか? – MYGz
'string.split( '').length'を実行するだけです。 – Rajesh
あなたのスクリプトは文字列にマッチするだけですが、単語は数えません。文字列にマッチする必要があるのは '^ \ * AUY。*'です。これはあなたが探しているものですか?文字列中の単語の数を数えるためにあなたが試したコードは何ですか? –