2017-07-04 9 views
0

Webページから値を抽出したいのですが、特定のXML構造体では集計値を取得するようです。私はテキストを抽出した場合rVest:値を抽出する方法(子を無視する)

data 
{xml_nodeset (1)} 
[1] <span class="match">tusinde<span class="super">1</span></span> 

私が手:

data %>% html_text() 
tusinde1 

私は何をしたいことは次のとおりです。

tusinde 

答えて

1

一般的な質問で再現性の例の詳細な背景がなければ、それはすることは困難です特定の例を超えて機能するソリューションが必要です。

たとえば、次のコードは問題を解決しますが、その特定のケースを超えて一般化するのがどれほどうまくいくかはわかりません。

data <- "<span class=\"match\">tusinde<span class=\"super\">1</span></span>" 

out <- data %>% read_xml() %>% xml_contents() 

as.character(out[1]) 

はあなたに与える:

[1] "tusinde" 
関連する問題