Pythonでウェブサイトのソースコードの行を取得するには？

-1

ウェブサイトのソースコードのx行を取得するには？Pythonでウェブサイトのソースコードの行を取得するには？

私はこのような機能が必要：

デフsource_codeが（URL、ライン）： ...

2017-08-22 Red Eyed Tree Frog

http要求を開き、応答を解析して回線番号xを返しますか？リクエストまたはurllib3のpythonモジュールをチェックしてください – AK47

私はあなたが見てみることをお勧めします - > Beautifulsoup –

*私はこのような機能が必要です*。次に、好きなコードエディタを起動して、コードエディタを作成します。これはコード作成サービスではありません。最初に問題を解決するために努力してください。問題が発生した場合は、遭遇した問題について説明し、コードの*関連部分を含めて、そのコードに関する特定の質問をしてください。 See [ask]。 –

における標準ライブラリのモジュールがありますがPython：urllib2、あなたもチェックアウトできますpython-reクエスト 次を試してみてください。

import urllib2 
resp = urllib2.urlopen("The URL of the webpage whose source code you want")

今すぐhttps://www.crummy.com/software/BeautifulSoup/bs4/doc/通過し、これはあなたが、解析のために使用することができますBeautifulSoup、です。その行を使用して取得する行の条件を設定することができます。

出典

2017-08-22 12:56:41

さて、あなたは、ページのHTMLコンテンツを保存like this、およびファイルの機能を使用して行に移動することができます

file_awesome = open('saved_html.html', 'r') 
    content = file_awesome.readlines() 
    print(content[7])

出典

2017-08-22 12:58:30 Abe

このそれに

import requests 

def source_code(url, line): 
    # get the page source code and split each line 
    lines = requests.get(url).text.split('\n') 

    # page source code had too few lines 
    if len(lines) < line : return '' 
    else: return lines[line-1] 


print(source_code('somepageurl', 9))

出典

2017-08-22 13:00:37 Anonta

を行う必要があり、利用要求モジュール

を

import requests as req 
url = '"http://www.something.com"' 
resp = req.get(url) 
print(resp.text) # html response

出典

2017-08-22 13:18:00

Pythonでウェブサイトのソースコードの行を取得するには？

答えて

関連する問題