0
私はrvestを使用して内部ウェブサイトのHTMLテーブルからデータをスクラップしています。行の色は意味があるので、BGCOLOR
属性を最終表の列として抽出しますが、もちろんhtml_table()
は内容を抽出するだけです。ウェブスクラップしたhtmlテーブルに属性を含める方法
これまで私がこれまで持っていたことは次のとおりです。 htmlテーブルのスニペットは次のとおりです。色の列を含めるにはどうすればよいですか?
html_nodes(samplepage,"table")
tbl_content <- samplepage %>%
html_nodes("table") %>%
html_table(fill = TRUE, trim = TRUE)
tbl_content
<tr BGCOLOR = "#F8C0E0">
<td> BASOPHILS <td> microl <td> 0.477 <td> 0.425 <td align="center"> 0.052 <td align="center"> 1.920 <td align="center"> 51.5 <td align="center"> 32
</tr>
<tr BGCOLOR = "#F8F0B0">
<td> CALCIUM <td > mg/dl <td> 12.2 <td> 1.7 <td align="center"> 7.6 <td align="center"> 14.9 <td align="center"> 71 <td align="center"> 33
</tr>
すごいです!私は2番目の、より簡単な方法を使用し、それは魅力のように働いた。しかし、html_table()関数でheader = FALSEを設定しなければなりませんでした。ありがとうございました! – cricketbird