2017-08-22 14 views
-1

ウェブサイトのソースコードのx行を取得するには?Pythonでウェブサイトのソースコードの行を取得するには?

私はこのような機能が必要:

デフsource_codeが(URL、ライン): ...

+1

http要求を開き、応答を解析して回線番号xを返しますか?リクエストまたはurllib3のpythonモジュールをチェックしてください – AK47

+0

私はあなたが見てみることをお勧めします - > Beautifulsoup –

+1

*私はこのような機能が必要です*。次に、好きなコードエディタを起動して、コードエディタを作成します。これはコード作成サービスではありません。最初に問題を解決するために努力してください。問題が発生した場合は、遭遇した問題について説明し、コードの*関連部分を含めて、そのコードに関する特定の質問をしてください。 See [ask]。 –

答えて

1

における標準ライブラリのモジュールがありますがPython:urllib2、あなたもチェックアウトできますpython-reクエスト 次を試してみてください。

import urllib2 
resp = urllib2.urlopen("The URL of the webpage whose source code you want") 

今すぐhttps://www.crummy.com/software/BeautifulSoup/bs4/doc/通過し、これはあなたが、解析のために使用することができますBeautifulSoup、です。その行を使用して取得する行の条件を設定することができます。

1

さて、あなたは、ページのHTMLコンテンツを保存like this、および ファイルの機能を使用して行に移動することができます

file_awesome = open('saved_html.html', 'r') 
    content = file_awesome.readlines() 
    print(content[7]) 
1

このそれに

import requests 

def source_code(url, line): 
    # get the page source code and split each line 
    lines = requests.get(url).text.split('\n') 

    # page source code had too few lines 
    if len(lines) < line : return '' 
    else: return lines[line-1] 


print(source_code('somepageurl', 9)) 
2

を行う必要があり、利用要求モジュール

import requests as req 
url = '"http://www.something.com"' 
resp = req.get(url) 
print(resp.text) # html response 
関連する問題