私は役に立たないテキストの中で、URLを特徴とするテキストブロックを処理するPythonコードを書いています。テキストブロックのうち、私はドメインだけを必要とし、完全なURLは必要としません。例入力:だからここURLのドメイン部分のみをregexと照合するにはどうすればよいですか?
47.91.158.176 or 54.145.185.110 port 80 - gooolgeremf.top - GET /search.php
47.90.205.113 or 35.187.59.173 port 80 - voperforseanx.top/site/chrome_update.html
私だけgooolgeremf.top
と一致voperforseanx.top
必要がありますが、私が書いた正規表現もsearch.php
とchrome_update.html
と一致します。
私が考えているのは、正規表現が/
の後で一致しなくてはならないということです。しかし、私はそれを実装する方法、特にテキストファイル全体の最初の/
の後に現れる一致するドメインを防ぐ方法を知らない。
それは私のコードでは、これまで動作する方法:
regexdm="[A-Za-z0-9]{1,}\.[A-Za-z0-9]{1,10}\.?[A-Za-z]{1,}\.?[A-Za-z]{1,}"
dmsc=re.findall(regexdm, iocsd.read())
FQDN /ホスト名、またはドメイン名のみを意味しますか? – mootmoot