私はPythonの初心者です。ページ内のすべてのリンクを取得するための小さなプログラムを作成しました。私はPython 2.7を使用しています。これは、Ubuntuに付属しています。コードをまとめるためにさまざまなソースを使用しましたが、ライブラリがないか、間違ったバージョンのPythonに正しいライブラリを使用しているようです。パイソン後pythonでurlibとbeautifulsoupをインストールする2.7
Traceback (most recent call last):
File "test.py", line 12, in <module>
html_page = urllib2.urlopen(url)
File "/usr/lib/python2.7/urllib2.py", line 154, in urlopen
return opener.open(url, data, timeout)
File "/usr/lib/python2.7/urllib2.py", line 421, in open
protocol = req.get_type()
File "/usr/lib/python2.7/urllib2.py", line 283, in get_type
raise ValueError, "unknown url type: %s" % self.__original
ValueError: unknown url type: www.cs.odu.edu
私がインストールされているBS4、urlib:
import sys
from bs4 import *
import urllib2
import re
if len(sys.argv) != 2:
print "USAGE:"
print "Python test.py Your_URL"
else:
url = sys.argv[1]
html_page = urllib2.urlopen(url)
soup = BeautifulSoup(html_page)
for link in soup.findAll('a'):
print link.get('href')
私はこのエラーを取得しています。それでも同じエラー。
須藤はaptのpythonをインストール
sudoはあなたがプロトコルなしでブラウザにURLを入力すると、それはHTTPデフォルト、BS4
ありがとうございます!完璧に働いた! –