大きなファイルから特定のコンテキストに囲まれたすべての単語を探して抽出したいと思います。ファイル内のすべての行が>
と<\w>
間で異なる言葉ではなく、このようなようなものを見て:grepを使用して特定のコンテキストで文字列を検索
<="UO" lemma="|" lex="|" sense="|" prefix="|" suffix="|" compwf="|" complemgram="|" ref="05" dephead="04" deprel="ET">and<\w>
私は唯一の出力が可能「と」したいと思います。だから私は基本的に文脈にあるすべての文字列(単語、句読点、数字)を抽出したい。>xxx<\w>
and
we
appreciate
this
very
much
.
:私は、出力は次のようになりたいと思うファイル全体から...私はgrepをし、正規表現と異なる選択肢の束を試みたが、私は>
と<\w>
ですべての単語またはパターンを得るのいずれかそれで...
入力テキストと予想される出力を追加 – RomanPerekhrest
申し訳ありませんが、何らかの理由で初めて –
を投稿したときに表示されませんでした。「私は出力が欲しいだけです」とあなたが達成しようとしていることの十分な説明ではありません。出力をどのように表示するかの例を教えてください。それ以外の場合は、このコードを使用することをお勧めします。 'echo"と " – sadmicrowave