無限のロードページを掻き分ける方法R

私は小規模な研究のためにいくつかのニュースメディアページを削ってきました。そして私はこれを遭遇しましたpageあなたがスクロールすると記事が読み込まれます。私はF12の検査官の応答を監視してみたところ、特定の数の記事の後にページが実際に別々に読み込まれることを（XHRファイルで）考え出しました。無限のロードページを掻き分ける方法R

は私も

は、しかし、私はどのように Rにこの情報をロードするには見当がつかない、スクリーンショットは、私が何を意味するかを示すために、インスペクタでそれらのURLを参照してくださいすることができます。私は Rvestを使用していましたが、HTTRのようにここが役に立つのかどうかはわかりません。

ありがとうございました！

出典

2017-05-23 Vladislav Petkevic

ウェブブラウザの動作を模倣するRSeleniumを使用することをお勧めします – amonk

あなたはこのエンドポイントでの生のJSON経由ページができます。

http://kolumbus-api.lrytas.lt/query/?count=&tag_slugs=politika&type=Video,Articolo&order=pubfromdate-&ret_fields=props.type__AS__type,props.media[indexof(x.type=%27media%27%20for%20x%20in%20props.media)][%27hd-alternate-href%27]__AS__thumb,props.categories[0].name__AS__category,props.href__AS__href,props.title__AS__title,props.commentCount__AS__commentCount,props.media[indexof(x.type=%27media%27%20for%20x%20in%20props.media)].otheralternate.1280x720.href__AS__imgxl,props.media[indexof(x.type=%27media%27%20for%20x%20in%20props.media)].otheralternate.300x200.href__AS__imgm,props.media__AS__media_json&page=1

だけのページが一番最後にページパラメータを変更して：あなたは最後にpage=1に達するまで。

出典

2017-05-23 22:11:40

無限のロードページを掻き分ける方法R

答えて

関連する問題