2017-05-23 6 views
0

私は小規模な研究のためにいくつかのニュースメディアページを削ってきました。そして私はこれを遭遇しましたpageあなたがスクロールすると記事が読み込まれます。私はF12の検査官の応答を監視してみたところ、特定の数の記事の後にページが実際に別々に読み込まれることを(XHRファイルで)考え出しました。無限のロードページを掻き分ける方法R

は私も

screenshot

は、しかし、私はどのように Rにこの情報をロードするには見当がつかない、スクリーンショットは、私が何を意味するかを示すために、インスペクタでそれらのURLを参照してくださいすることができます。私は Rvestを使用していましたが、HTTRのようにここが役に立つのかどうかはわかりません。

ありがとうございました!

+0

ウェブブラウザの動作を模倣するRSeleniumを使用することをお勧めします – amonk

答えて

0

あなたはこのエンドポイントでの生のJSON経由ページができます。

http://kolumbus-api.lrytas.lt/query/?count=&tag_slugs=politika&type=Video,Articolo&order=pubfromdate-&ret_fields=props.type__AS__type,props.media[indexof(x.type=%27media%27%20for%20x%20in%20props.media)][%27hd-alternate-href%27]__AS__thumb,props.categories[0].name__AS__category,props.href__AS__href,props.title__AS__title,props.commentCount__AS__commentCount,props.media[indexof(x.type=%27media%27%20for%20x%20in%20props.media)].otheralternate.1280x720.href__AS__imgxl,props.media[indexof(x.type=%27media%27%20for%20x%20in%20props.media)].otheralternate.300x200.href__AS__imgm,props.media__AS__media_json&page=1 

だけのページが一番最後にページパラメータを変更して:あなたは最後にpage=1に達するまで。

関連する問題