ウェブサイトから.mp3リンクを取得できるウェブクローラーを作りたいと思います。ただし、コンテンツは例のサイトhttp://raagtune.net/では動的です。このサイトでは、コンテンツは"http://raag.me//music/data/ .. some random .mp3"から取得されます。サイト全体をクロールして、どのようにしてpythonでscrapyを使用してすべてのMP3リンクを取得できますか?それとも代替方法がありますか?スクラップでWebクローラーを作成して.mp3リンクを取得する方法
-1
A
答えて
0
beautifulsoup
pythonのパッケージを使用できます。
import httplib2 from BeautifulSoup import BeautifulSoup, SoupStrainer http = httplib2.Http() status, response = http.request('http://www.nytimes.com')
for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('a')): if link.has_attr('href'): print link['href']
ちょうどそのURLは、そのリンクで.mp3
を持っているかどうかを確認してください。はいの場合は、それをリストに格納してから続行します。
希望すると便利です。
関連する問題
- 1. PythonでWebクローラーを作成中にアンカータグを取得する
- 2. JavaでWebクローラーを作成する方法
- 3. cronを使用してPHP Webクローラーを作成する
- 4. R:URLリストをWebスクラップしてDataFrameを取得する
- 5. Node.jsアプリでJavascriptを使用して外部Webページの情報/ Webスクラップを取得する方法は?
- 6. 直接リンクを作成してuriセグメントを取得する方法
- 7. mp3ファイルの「タイトル」と「作成者」の属性を取得する方法
- 8. 複数のログインなしでpdfファイルを取得するためのPythonのWebスクラップを作成する
- 9. Android:HTTPページを取得してスクラップする
- 10. Webクローラーがページ内のすべてのリンクを開けない
- 11. powershellを使用して動的Webページからデータを取得するWebクローラーを作成することはできますか?
- 12. リンクをたどるためにスクラップを取得できない
- 13. サブページを並行してWebをスクラップする方法は?
- 14. PHPを使用してWebページをスクラップする方法は?
- 15. リンクからURLを取得してスクリプトを作成する
- 16. jsmediatagsを使ってmp3からアルバムアートを取得する方法
- 17. シンプルなpython Webクローラーを作成しようとしています
- 18. python3を使ってagodaから複数のページを取得するためのWebクローラーを作成する方法
- 19. データベースから取得したデータからリンクを作成する方法
- 20. スクラップを使用してメインスクリプトからスクラップしたアイテムを取得する方法は?
- 21. このリンクのすべてのページをスクラップする方法
- 22. バックスキャンAPIを作成してディカプリュファイルを取得する方法
- 23. テレグラムボットでリンクを作成する方法
- 24. WebクローラーのAJAXブロックを扱うか、手動で入力を作成する
- 25. CでのMP3の長さを取得する方法
- 26. AndroidでMP3ファイルの再生時間を取得する方法
- 27. スクラップしてインデックスを作成する法的スクリプト?
- 28. コアデータにリレーショナルレコードを作成して取得する方法
- 29. カテゴリごとにテキストをスクラップしてjsonファイルを作成する方法は?
- 30. スクラップを使用して曲をスクラップする方法