特定のドメインのすべてのサブドメインに一致する正規表現が必要です。コンテンツのメディアタイプが不明です(IGがJSONなど、URLエンコードすることができる) これまでのところ私は、問題は、この文字列全体、以下のように文字列を取得する代わりにFoundであるということである。この単純な正規表現 re, err := regexp.Compile(`([-a-z0-9])+[.](.*)domain.com`)
regex match subdomain
を持っています特定sudomainsは、このような抽出prefix1-prefix2.domain.com
ので質問は正規表現、私は余分な文字列のない唯一のサブドメインを取得する必要が何をすべきかである(すなわち%2Fdocument...
)
prefix1-prefix2.domain.com%2Fdocument%2F%3Fusp%3Dmkt_docs%26lng%3Den&followup=https%3A%2F%2Fprefix1-prefix2.domain.com%2Fdocument%2F%3Fusp%3Dmkt_docs%26lng%
これは、URLを解析することがすぐに複雑になり、URLライブラリが適切なURL部分を引き出すことができるようになります。 – Matt
かなり同意する - それは私がお勧めする方法です;)それはもう1つの利点を持っていますurl libエラーと無効なシーケンスのURLをチェックします。私は上記のレシピを載せました。 –
私はJavaScript(ソースコード)からURLを抽出するためにそれを使用しましたが、私は多くのゴミで終わりました。データの抽出や検証にはお勧めできません。従来の理由から、Goチームはデータ抽出/検証ツールにしたくないからです。 – Books