Scrapyを使用して一部のデータをクロールしています。私がブラウザでproduct detailを開ける度に、ブラウザーで要求されたthis requestが常に正しい内容を返すようになりました。
ブラウザで上記のリクエストを開いた場合、正しいコンテンツが約10回返されました。そして、「?????」という文字を追加して間違った内容を返しました。
この問題がなぜ発生するのか説明できますか?そしてScrapyを実際のブラウザとして動作させる方法は?
これは正しいコンテンツGETリクエストによって異なるJSONコンテンツが返される
{"itemid": 43369300, "liked": false, "offer_count": 6, "videos": [], "image": "41dabd8fe9b7cbc2ab30501592f65a80", "image_list": ["41dabd8fe9b7cbc2ab30501592f65a80", "91bf75885fffd2b1fbcc55099457bc22", "f4516bb9667f8329f031ff75896a71fd", "d2639a1ffe75912873de6d8e011dc0dd", "38d00637b021e1701542a6afa7ae58f3", "10ab99e3bd211bd4dd63993555d6454b"].....
であり、これはあなたが、他の要求request1とrequest2をテストすることができ、間違った内容
{"itemid": 43369300, "liked": false, "offer_count": 10, "videos": [], "rating_star": 4.069458216402549, "image": "41dabd8fe9?????????????????????", "image_list": ["41dabd8fe9?????????????????????", "91bf75885f?????????????????????", "f4516bb966?????????????????????", "d2639a1ffe?????????????????????", "38d00637b0?????????????????????", "10ab99e3bd?????????????????????"].....
で、...
"????"あなたが何度も何度も同じURLで起こるのでしょうか?また、ペーストビンにコンテンツを投稿してリンクを投稿する –
私はあなたのコメント@TarunLalwaniとして私の質問を編集しました –
私は確認し、ブラウザで5-10回、同じ要求の変更のコンテンツをリフレッシュします。これは明らかに実際の保護を掻き立てています。プロキシを使用してリクエストを回転させる必要があります –