の前で複数のテーブルをこする:https://prog.nfz.gov.pl/app-jgp/GrupaSzczegoly.aspx?id=2AfRAM1JYDoYzktSMvdOhFiPm2Fnh67qrvest:私はこのURLをこすりしたいタイトル
これは、各地域の医療処置の統計情報を一覧表示し、HTMLは以下の構造を有する:すべてのタイトルと対応するテーブル、16回国の地域。単純化されたHTMLで
:私は(私ができるならば、それは大丈夫だと思う)私は彼らからの1つのまたは2つの値を必要とするテーブル全体をこすりする必要はありません
<div class="tytul">01 - NameOfDistrict_01</div>
<table>
...
<tr>
<td class="lewa">No. of procedures</td>
<td class="prawa"><span id="ContentPlaceHolder1_lblbw">950</span>
</td>
...
</table>
<div class="tytul">02 - NameOfDistrict_02</div>
<table>
<tr>
...
<tr>
<td class="lewa">No. of procedures</td>
<td class="prawa"><span id="ContentPlaceHolder1_lblbw">350</span>
</td>
...
</td>
</table>
<div class="tytul">nn - NameOfDistrict_nn</div>
<table>
...
<tr>
<td class="lewa">No. of procedures</td>
<td class="prawa"><span id="ContentPlaceHolder1_lblbw">850</span>
</td>
...
</table>
ので、私はセレクターガジェットを見てみましたページを調べます。私が興味を持っている値の1つは、ノードに存在する手続きの数です。#ContentPlaceHolder1_lblbwそして、タイトルの前には、.tytulというクラスが先行しています。
mydata <- read_html(....) %>% html_nodes(name, "#ContentPlaceHolder1_lblbw") %>%
html_text()
ただし、このプレースホルダは各地域で繰り返されます。私はテーブルの上のタイトルの後に最初のそのようなプレースホルダーを読む必要があります。それに続く各タイトルとテーブルを記録します。私は、これはあなたが探しているものんだと思うどのようにデータフレーム
District No. of procedures
NameOfDistrict_01 950
NameOfDistrict_02 350
............................
NameOfDistrict_nn 850
これは簡単ですか?私はループか2つが必要であると思っていた。どうもありがとう。 –