別のWebページのHTMLテーブルからデータを抽出する方法はありますか？

コンピュータがそのデータを読んでそれをコンピュータプログラムに撃ってそのデータを使用できるようにする方法があれば、私は不思議でした。たとえば、私がESPNのサイトに行くことができ、リーグの順位を見て、自分のコードにレコードを送ることができると思います。いくつかのサイトには使用できるAPIがありますが、私が使用するサイトはありません。別のWebページのHTMLテーブルからデータを抽出する方法はありますか？

出典

2016-07-07 Riley

Nopesを。ありえない。 CORS。 –

公開APIをお持ちでない場合は、[Web Scraping]（https://it.wikipedia.org/wiki/Web_scraping）で略奪を受けることができます – Signo

ESPNのサーバーにリクエストするサーバーにリクエストを送信できますデータをフェッチする。 – gcampbell

私はPythonでBeautiful Soup（https://www.crummy.com/software/BeautifulSoup/bs4/doc/）を使って機械学習目的でデータスクレイピングを実装しました。それは、ページのHTMLをつかんでオブジェクトに変換することで「きれいに」動作します。このオブジェクトを操作して、特定のタグ、たとえばテーブルタグを検索することができます。

出典

2016-07-07 14:11:48 brotatotes

これを行う最善の方法は、技術的に賢明ではない場合はかなり先進的なウェブスクレイピングです。これは、HTML以上のものが必要になります。あなたがあなた自身を構築したくない場合は多分これを試してみる：

http://webscraper.io/

出典

2016-07-07 14:12:32

別のWebページのHTMLテーブルからデータを抽出する方法はありますか？

答えて

関連する問題