2012-03-12 12 views
1

私はこのような長い行を持っている:HTMLテキストで複数の非貪欲なマッチをgrepするには?

<div class="interesting">This is interesting1</div><div class="not interesting">Some text</div><div class="interesting">This is interesting2</div><div class="not interesting">Some more text</div> 

は、どのように私は次のように抽出することができます。

This is interesting1 
This is interesting2 

上のテキストからのgrepを使用していますか?助言がありますか?

cat temp | grep -o "<div class=\"interesting\">.*?</div>" 

は何も出ていないようです。

答えて

1
cat temp | grep -P -o "<div class=\"interesting\">(.*?)</div>" 

括弧は、そのhtmlタグ内の項目の項目と一致します。

+1

ありがとうございます。私はこれを既に試してみましたが、何らかの理由でこれで出力が得られません。 – Legend

+1

+1答えを '-P'フラグを含めて修正しました。ありがとう! – Legend

+0

ニース!答えを受け入れる? – iambriansreed