を開始する単語を決定するために、コマンドラインや正規表現を使用して、私はテキストを持っている:文章
This is a test. This is only a test! If there were an emergency, then Information would be provided for you.
私は言葉が文章を開始するかを決定することができるようにしたいです。私が今持っていることは次のとおりです。
$ cat <FILE> | perl -pe 's/[\s.?!]/\n/g;'
これだけ句読点を取り除くと改行に置き換え、私を与えます:
This
is
a
test
This
is
only
a
test
If
there
were
an
emergency,
then
Information
would
be
provided
for
you
ここから私は何とか(それらの上には何もいずれかを持っていない単語を抽出できファイルの開始)または空白のスペースが必要ですが、これを行う方法がわかりません。だから、コマンドラインとして
[文の最初の単語と一致する正規表現](http://stackoverflow.com/questions/14767080/regex-to-match-first-word-in-sentence) –
私が探しているものではありません。一致する場合は、句読点が含まれます。また、grepでマッチを抽出する方法もわかりません。 – basil