2012-01-28 9 views
0

httpclientレスポンスからページ名を抽出しようとしています。 正規表現を使用して、/ bts形式のすべてのリンクを抽出します。 (この部分は正常に動作していて、望ましくないリンクは得られません) 例:パターンが "bts/pagename.htm"の場合>リンクの名前 "そのページ名を抽出したい場合は、 フル上記の例では、しかし、私はパターンの残りの部分がないだけのページを抽出するように見えることはできません。pattenのimマッチングはbts/toですが、私はそれらを私の出力に保持したいと思いません。そして、.htmの で終わりたぶんその不可能イムいないことを確認リンクからURLページのファイル名を抽出します。

+0

例をもう少し明確にしてください。 – RanRag

答えて

0

は、ファイル名の文字列を抽出したいですか?

を私は正規表現では非常に良好ではないんです。でも、多分あなたは、この

012を試すことができます
(?<=/)\w+(?=.) 
関連する問題