2016-07-07 10 views
0

コンピュータがそのデータを読んでそれをコンピュータプログラムに撃ってそのデータを使用できるようにする方法があれば、私は不思議でした。たとえば、私がESPNのサイトに行くことができ、リーグの順位を見て、自分のコードにレコードを送ることができると思います。いくつかのサイトには使用できるAPIがありますが、私が使用するサイトはありません。別のWebページのHTMLテーブルからデータを抽出する方法はありますか?

+1

Nopesを。ありえない。 CORS。 –

+0

公開APIをお持ちでない場合は、[Web Scraping](https://it.wikipedia.org/wiki/Web_scraping)で略奪を受けることができます – Signo

+0

ESPNのサーバーにリクエストするサーバーにリクエストを送信できますデータをフェッチする。 – gcampbell

答えて

0

私はPythonでBeautiful Soup(https://www.crummy.com/software/BeautifulSoup/bs4/doc/)を使って機械学習目的でデータスクレイピングを実装しました。それは、ページのHTMLをつかんでオブジェクトに変換することで「きれいに」動作します。このオブジェクトを操作して、特定のタグ、たとえばテーブルタグを検索することができます。

0

これを行う最善の方法は、技術的に賢明ではない場合はかなり先進的なウェブスクレイピングです。これは、HTML以上のものが必要になります。あなたがあなた自身を構築したくない場合は多分これを試してみる:

http://webscraper.io/

関連する問題