0
新聞の記事を拝見しており、複数のノードを除外する方法を理解するのに苦労しています。 Rヘルプは、:not()
がシンプルなセレクタのシーケンスを受け入れると言います。私は以下を試した複数のノードを抽出するRVest
zeit_url <- read.html("http://www.zeit.de/wissen/gesundheit/2017-09/aids-hiv-neuinfektionen-europa-virus-gesundheit)
article <- zeit_url %>%
html_nodes('.article-page>:not(.ad-container, .cardstack)') %>%
html_text()
2つのノードをカンマで区切ることはできません。 :not()
にセレクタのシーケンスを正しく指定する方法はありますか?
私は答えを探すのに多くの時間を費やしましたが、私はR(およびHTML)を初めて使っています。これが明らかなことがあれば、辛抱強くお礼申し上げます。
今、あなたのコードには引用符と括弧がありません。そのページには 'article-age'というクラスがありませんので、あなたが得ようとしているものは不明です。 – alistaire
申し訳ありませんが、私は自分のコードで修正しました! –