2016-07-17 8 views
1

このURLのデータをスクラップしようとしています。http://poker.srv.ualberta.ca/preflopページには、異なる四角にカーソルを移動すると、プリフロップアクションのみを表示するインタラクティブなテーブルが表示されます。私はソースコードをチェックし、すべての情報はクラスの統計情報の要約にありますが、統計情報の要約はカーソルの位置によって変わります。 lxmlと要求を使用してENTIREテーブルを外挿する方法はありますか?私は全員ではなく、単一のポジションでそれを行うことができます。画面上のカーソルの位置に応じて変化するインタラクティブなチャートからのデータのスクラビング

これまでの私のコード:

from lxml import html 
import requests 
page = requests.get("http://poker.srv.ualberta.ca/preflop") 
tree = html.fromstring(page.content) 

答えて

-1

グラフの後ろにデータをロードするAJAX呼び出しがないことがわかりました。

グラフのデータをロードできるのは、自分のサイトのJSファイルからです。

すべてのJSファイルを見て、その値をどのように計算しているかを確認することをお勧めします。

ここには、サーバー上のJSファイルの一部があります。

http://poker.srv.ualberta.ca/data/crPreflop.js

http://poker.srv.ualberta.ca/data/cPreflop.js

あなたはそれらのファイル内のデータを研究一日を過ごすために必要があります、あなたは把握します。

+0

ありがとうございましたこれは私が探していたものです – Trevbearcat

1

私はあなただけでlxmlのと要求を使用して、これを行うことができると思ういけません。これはd3のチャートで、おそらくマウスのmouvementsをエミュレートするためにphantomjsのようなヘッドレスブラウザを使用して掻き集めることができます。取得しようとしているデータは、ページソース(end ob bodyタグの前)をチェックするとjavascriptオブジェクトとして利用できます。ここに私が見つけたファイルの例があります。 http://poker.srv.ualberta.ca/data/rPreflop.js