をキャプチャするテキストよりも、根本的なHTMLを引っ張っSelectorGadgetとRVestの使用:私はこの1つは、特定のことを、basketballreference.comからのデータの列を引くしようとしています、むしろ私は
使用http://www.basketball-reference.com/teams/ATL/2016.html
selectorGadget私は、私が必要とするページの部分をハイライトすることができます、そして、それは私にhtml_nodes関数をintにするパラメータを与えます。しかし、私は選手の名前を引き出そうとしていますが、セレクタガジェットの出力をコピーして貼り付けると、名前に含まれるリンクが表示されます。私は、誰かがそれが含まれているリンクではなく、実際のテキストとどのようにマッチさせるかを知っているかどうか疑問に思っていました。たとえば、リストの最初の名前はKent Bazemoreです。私はそれがケント・ベイズモアを返すしたいと思いますが、代わりにそれは根本的なHTMLキャプチャされています。誰もが、私は助けを本当に感謝これをクリーンアップする方法上の任意のアドバイスを持っている場合
{xml_node} 'a href="/players/b/bazemke01.html"'
を。ありがとうございました。
ありがとうございました、これは完全に働きました – gseelig