URI.extractを使用してテキスト内のURL(この例では電子メール)を識別して処理します。末尾の角カッコを含むURI抽出]
A少し迷惑な機能は、スキーム
urls = URI.extract(text, ['http', 'https', 'cid','mailto'])
を経由して抽出するとき、彼らは彼らの周りに括弧付きのテキストに含まれている場合は、それらのいくつかは、末尾の角括弧で戻ってくるということです。
私が使用しているすべてのURLパーサを壊す末尾の閉じ括弧に注目してください。
これを停止するには賢明な方法がありますか?
URI.extractのドキュメントは非常に短いです。
ありますか?私はかなりURLの中にすべきではないと確信していますが、常にあなたのお尻にあなたを刺させるいくつかの端の場合があります – Carpela
技術的な角括弧はURIで許されているので、 'extract'は誤動作していません。 (実際には、Railsは 'var [] ='のようなものをたくさん使います)。しかし、 'mailto:'スキームは別のRFCで定義されており、おそらくそこでは許可されません。 'URI'は洗練されていないかもしれません。 –
興味深いことに、私はmailto:とcid:typeのリンクの周りにエラーが出る傾向があります。おそらくそれはそれを説明するかもしれない。 – Carpela