これは私のhtmlです:python pandas 'read_htmlで複数のtbodiesを持つhtmlテーブルを読むには?
import pandas as pd
html_table = '''<table>
<thead>
<tr><th>Col1</th><th>Col2</th>
</thead>
<tbody>
<tr><td>1a</td><td>2a</td></tr>
</tbody>
<tbody>
<tr><td>1b</td><td>2b</td></tr>
</tbody>
</table>'''
私はdf = pd.read_html(html_table)
を実行し、print(df[0]
場合は私が手:
Col1 Col2
0 1a 2a
コル2が消滅します。どうして?それを防ぐ方法は?
HTMLは私のコードではありません。私はBeautifulsoupでhtmlを読んで、パンダで読む前にすべてのtbodiesを削除するかもしれません。 – foebu