2017-01-22 16 views
0

私はPythonの初心者です。ページ内のすべてのリンクを取得するための小さなプログラムを作成しました。私はPython 2.7を使用しています。これは、Ubuntuに付属しています。コードをまとめるためにさまざまなソースを使用しましたが、ライブラリがないか、間違ったバージョンのPythonに正しいライブラリを使用しているようです。パイソン後pythonでurlibとbeautifulsoupをインストールする2.7

Traceback (most recent call last): 
    File "test.py", line 12, in <module> 
    html_page = urllib2.urlopen(url) 
    File "/usr/lib/python2.7/urllib2.py", line 154, in urlopen 
    return opener.open(url, data, timeout) 
    File "/usr/lib/python2.7/urllib2.py", line 421, in open 
    protocol = req.get_type() 
    File "/usr/lib/python2.7/urllib2.py", line 283, in get_type 
    raise ValueError, "unknown url type: %s" % self.__original 
ValueError: unknown url type: www.cs.odu.edu 

私がインストールされているBS4、urlib:

import sys 
from bs4 import * 
import urllib2 
import re 

if len(sys.argv) != 2: 
    print "USAGE:" 
    print "Python test.py Your_URL" 
else: 
     url = sys.argv[1] 

html_page = urllib2.urlopen(url) 
soup = BeautifulSoup(html_page) 
for link in soup.findAll('a'): 
    print link.get('href') 

私はこのエラーを取得しています。それでも同じエラー。

須藤はaptのpythonをインストール

sudoはあなたがプロトコルなしでブラウザにURLを入力すると、それはHTTPデフォルト、BS4

答えて

2

あなたのURLの前に、HTTPまたはHTTPSを指定してみてください、それは間違いなく動作します。

関連する問題