2016-11-06 17 views
-2

私はRに取り組んでいます。私はページのコードからデータを抽出し、それをデータフレームに変換したいと考えています。R - div内のデータを抽出する

<div class="item clearfix" artist="Georges" song="Melody" ...> 
<div class="item clearfix" artist="Leonard" song="Inspiration" ...> 
<div class="item clearfix" artist="Bill" song="Gold" ...> 

:私は興味のコードがある私は、私がやりたいことは、この1(BeautifulSoup extract data within a div)に近いと思いますが、可能であれば、私はここでR.

でそれをやってみたいです私はそれを持ってしたいよう:私が読ん

Data Frame

ほとんどの例では、テキスト間のテキストを取得しようとしているが、私の問題は少し異なっていると私は本当に私は始めるべきどこからか分かりません。

+0

rvestパッケージをご覧ください。 html_nodes関数とhtml_attr関数は、探している関数でなければなりません。 – Dave2e

+0

このようにした試行のコードを入力してください。 SOはコード作成サービスではありませんので、コードの最小限で完全な検証可能な例と実行した問題を提供するようお願いします。 –

+0

URLを指定していないため、サイトの利用規約に違反している可能性が高くなります。 URLを貼り付けて、うまくいかなかったRコードを表示するか、質問の削除を検討してください。また、画像はプロット用であり、データやコード用ではありません。 – hrbrmstr

答えて

2

ありがとうございました。もし私が言ったように、私はどこから始めるべきか、パッケージ/機能を使用するか分からなかった。

Dave2eの洞察に続いて、私は私の問題を解決できました。コードは次のとおりです。

info <- read_html(url) %>% html_nodes(xpath = '//*[@class="item clearfix"]') %>% xml_attr("artist") 
関連する問題