2017-01-29 17 views
0

私はBeautifulSoup/Pythonを使用してウェブサイトからテーブルを削り取ろうとしています。なんらかの理由で、テーブルの1つがコメントタグ内に存在するように見えます。私はコメントタグ内のテキスト全体を得ることができますが、その中のテーブルを見つけることができるように、そのテキストに対してfind_allコマンドを実行する方法を理解できません。コメントタグ内のタグを見つける - Python

コメントタグ内のテキストが、実際にはより多くのHTMLであることを伝える方法はありますか?

hockey-reference.com/boxscores/201701260BOS.html

コメント内の何もないので、私は、高度な統計レポートのセクションの下に2つのテーブル

+0

ありませんを取得しようとしていますHTML構造。それはコメントです。 *おそらく*一部のJavascriptコードは、読み込んだ後に(コメントではなくAJAX経由で)ページにデータを読み込むことに関係していますが、適切な例がないと実際には役に立ちません。 –

+0

http://www.hockey-reference.com/boxscores/201701260BOS.html 高度な統計レポートセクションの2つのテーブルを取得しようとしています –

+0

URLを投稿し、出力したいのは –

答えて

0
import re 

# use table text find comment text 
table_text = soup.find(text=re.compile('table class="adv sortable stats_table"')) 

# use bs4 to parse the text 
table_soup = BeautifulSoup(table_text, 'lxml') 
# find_all .... 
table_soup.find_all('tr') 
+1

です。ありがとう! –

関連する問題