私はXPathを初めて使っていますが、私はそれがどれほど強力かを見ることができます。私はこのlinkのソースコードを見ていて、次の2つのページから内容とユーザー名を抽出したいだけです。簡単にするために、ソースコードの一番上にあります。XMLパッケージを使用しているR内のXPath
コンテンツ= "戦争3の[アーカイブ] Simburgurさんのライブ ストリーム[オフライン] Gearsを" ここ
<div class="username">Simburgur</div>
はR内の私のコードです:
を返しdoc <- htmlParse("http://forums.epicgames.com/archive/index.php/t-672775.html")
xpathSApply(doc, "//head/meta[@name=\"description\"]")
[[1]]
<meta name="description" content="[Archive] Simburgur's Live Stream [Offline] Gears of War 3" />
明らかに、この例では、コンテンツの引用符の中にあるものだけが詰まっていますが、私の表現が取得した文字列を返すように見えません。
私は繰り返します。私はXPathの初心者です。 :)
良い質問、+1。私の答えは、2つの短く効率的な解決策を見てください。 :) –