私はPythonを勉強しています。 1つのURLにコンテンツを取得したいウェブサイト上の1つのタイトルのすべてのテキストを取得し、ファイル.txtに保存します。いくつかのコード例を教えてくださいPythonでウェブサイトコンテンツをクロールする方法
-1
A
答えて
0
Get all text in one title on the website
私はあなたがページのタイトルを得ることを意味すると思いますか?
あなたはpip
を持っている場合はまず、あなたがコード上に今
pip install beautifulsoup4
を使用し、BeautifulSoup
が必要になります:
今from bs4 import BeautifulSoup
from requests import get
r = get(url).text
soup = BeautifulSoup(r, 'html.parser')
title = soup.title.string #I save the title to a variable rather then jus
with open('url.txt', 'w') as f:
f.write(title)
、スクリプトを持って、これまでURLを含むurl.txt
というファイルが作成されます。
+0
'soup = BeautifulSoup(r、 'lxml')'、 'lxml'は' html.parser'より速く動作します – Jeril
関連する問題
- 1. PythonでWoSをクロールする
- 2. Python ScrapyでFactivaデータをクロールする方法は?
- 3. フィードをクロールする方法
- 4. Nutchで深くクロールする方法
- 5. jsonを取得するリクエストでpythonクロール
- 6. Pythonでのログイン後のクロール
- 7. pythonを使ってウェブサイトをクロールする
- 8. PythonのAsyncioがクロール
- 9. wget:ショップ(#)の文字でURLをクロールする方法
- 10. C#で添付された各ページコードをクロールする方法は?
- 11. サイトをクロールする重複エントリを避ける方法
- 12. ストリーミングツイートと過去のつぶやきをPythonでクロールする
- 13. Pythonでウェブサイトから複数のページをクロールする
- 14. Pythonでマルチプロセッシングを使用してScrapyを使用して何百万ものURLをクロールする方法は?
- 15. フロントエンドのjsフレームワークを持つWebサイトをクロールする方法
- 16. シングルクローラを使用して複数のドメインをクロールする方法
- 17. シェルスクリプトを使用してURLをクロールする方法は?
- 18. PythonでCSVファイルから特定のURLのみをクロールする方法はありますか?
- 19. URLをクロールするurl \ node.jsで動的リンクを取得する方法
- 20. Nutchを記事のクロールに拡張する方法
- 21. Scrapy - Microsoft SQL ServerデータベースにWebサイトとストアデータをクロールする方法
- 22. ファイルシステムとインデックスをクロールするのに最適な方法
- 23. ajax生成Webページをクロールする方法は?
- 24. Scrapyをセットアップして1つずつクロールする方法は?
- 25. クローラからのウェブサイトコンテンツの保護
- 26. フルシルバーライトの検索可能性ウェブサイトコンテンツ
- 27. クロールしているウェブページのリンクされたウェブページからデータをクロールする方法
- 28. インターネットをクロールする
- 29. Apache Nutch 2.3.1をサイドバーではなく記事コンテンツをクロールする方法を制限する方法
- 30. Pythonを使用して異なるWebサイトを一般的にクロールする方法は?
Google BeautifulSoupおよび/またはScrapy。そこにはたくさんのコード例があります。 –
StackOverflowの他の質問には多くの例があります。 – furas