2017-05-09 6 views
0

ファイル内で次の文字列が複数回繰り返されます。各行はhttpsで始まり、td>で終わります。特定の文字列と正規表現をどのように一致させることができますか?

https://xxxxxxtd> 
paila 
paila 
https://xxxxxxtd> 
paila 
https://xxxxxxtd> 
https://xxxxxxtd> 

は私がhttpsで始まる例のすべての文字列にマッチし、正規表現を使用してtd>で終了したいと思います:行が他の文字列と\ nで区切られています。 私は、次の正規表現を書かれているし、それはでテスト:https://regex101.com/が、それは動作しません。

^ht((.|\n)*)td\>$ 

それは何が不足していますか?

+0

行の先頭または最後にこの文がありますか?空白文字を含んでいますか? –

+0

あなたがしていることの具体的な例をいくつか挙げておき、一致させたくない場合は、より良い応答を得るでしょうが、私の推測では、 '*'を '*? 'に変更するとそのトリックが行われます。 – jsheeran

答えて

4

特殊文字ではない閉じ角括弧をエスケープする必要はありません。

あなたがそれを行う場合のシーケンス\>は(言葉の終わりに一致する)決算単語境界と見られているとリテラル>が消費されていないので、$アンカーが失敗します。

^https.*td>$ 

が有効です。

関連する問題