コメントタグ内のタグを見つける - Python

私はBeautifulSoup/Pythonを使用してウェブサイトからテーブルを削り取ろうとしています。なんらかの理由で、テーブルの1つがコメントタグ内に存在するように見えます。私はコメントタグ内のテキスト全体を得ることができますが、その中のテーブルを見つけることができるように、そのテキストに対してfind_allコマンドを実行する方法を理解できません。コメントタグ内のタグを見つける - Python

コメントタグ内のテキストが、実際にはより多くのHTMLであることを伝える方法はありますか？

hockey-reference.com/boxscores/201701260BOS.html

コメント内の何もないので、私は、高度な統計レポートのセクションの下に2つのテーブル

出典

2017-01-29 Joe Schroeder

ありませんを取得しようとしていますHTML構造。それはコメントです。 *おそらく*一部のJavascriptコードは、読み込んだ後に（コメントではなくAJAX経由で）ページにデータを読み込むことに関係していますが、適切な例がないと実際には役に立ちません。 –

http://www.hockey-reference.com/boxscores/201701260BOS.html 高度な統計レポートセクションの2つのテーブルを取得しようとしています –

URLを投稿し、出力したいのは –

import re 

# use table text find comment text 
table_text = soup.find(text=re.compile('table class="adv sortable stats_table"')) 

# use bs4 to parse the text 
table_soup = BeautifulSoup(table_text, 'lxml') 
# find_all .... 
table_soup.find_all('tr')

出典

2017-01-29 15:40:28

です。ありがとう！ –

コメントタグ内のタグを見つける - Python

答えて

関連する問題