可能性の重複:
Which characters make a url invalid?URLにはどのような文字が有効ですか?
私は大きな文字列の非URLの一部を除去しようとしています。私が見つけた正規表現のほとんどは[A-Za-z0-9-_.!~*'()]
のようですが、URLに含まれる可能性のあるものがさらにあります。 like http://127.0.0.1:8080/test?v=123#this
たとえば
有効なURLの最新の文字は何ですか?
EDIT:
彼らがあるように見える:
A-ZA-Z0-9 -._〜:?!/#[] @ $ &「()* +、; =そして%
あなたはRFCを見ましたか? http://www.faqs.org/rfcs/rfc1738.html – ale