0
私のコンピュータの.txt
ファイルにウェブサイトのHTMLコードを保存しました。しかし、スクリプトは最初のURLを出力し、全てではなく、他のリンクHTMLコードからURLを正しく抽出するにはどうすればよいですか?
def get_net_target(page):
start_link=page.find("href=")
start_quote=page.find('"',start_link)
end_quote=page.find('"',start_quote+1)
url=page[start_quote+1:end_quote]
return url
my_file = open("test12.txt")
page = my_file.read()
print(get_net_target(page))
:私は、次のコードを使用して、このテキストファイルからのすべてのURLを抽出したいと思います。どうしてこれなの?
ありがとうございました!私はPythonを初めて使っています。これを実装する方法の例を教えてください。それは非常に役に立ちます。 – jakeT888
私はあなた自身の開始コードでアルゴリズムを理解するのに役立つサンプルコードで答えを更新しました。 – SegFault