2016-11-03 10 views
1

私はこのlinkで与えられたスクリプトを使用してレビュー情報を取得しようとしていました。私は単一のページのために得ることができました。複数のページで入手する方法はありますか?Python - Flipkart APIのパラメータを使用

import requests 

data = {"productId": "MOBEG4XWJG7F9A6Z", # end of url pid=MOBEG4XWJG7F9A6Z 
     "count": "15", 
     "ratings": "ALL", 
     "reviewerType:ALL" 
     "sortOrder": "MOST_HELPFUL"} 

headers = ({"x-user-agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.92 Safari/537.36 FKUA/website/41/website/Desktop"}) 
data = requests.get("https://www.flipkart.com/api/3/product/reviews", params=data, headers=headers).json() 

私は次のようにパラメータを変更してみました::以下はコードです

data = {"productId": "MOBEG4XWJG7F9A6Z", # end of url pid=MOBEG4XWJG7F9A6Z 
     "count": "15", 
     "ratings": "ALL", 
     "reviewerType:ALL" 
     "sortOrder": "MOST_HELPFUL", 
     "page": "2"} 

しかし、私は同じ、以前のレビューを取得しています。私は、次のコマンドを使用して、URLパスを取得しようとしました:

data.request.path_url 

を、私は、ブラウザで取得したURLを貼り付けしようとしたときにそのエラーを返します。 ページ番号を反復するためにどのパラメータが使用されているかを見つける方法はありますか?お手伝いします。私は、Python

答えて

1

に新しいですそれは、現在のページを制御startパラメータです:

data = {"productId": "MOBEG4XWJG7F9A6Z", # end of url pid=MOBEG4XWJG7F9A6Z 
     "count": "15", 
     "ratings": "ALL", 
     "reviewerType": "ALL" 
     "sortOrder": "MOST_HELPFUL", 
     "start": "15"} # page number 2 
+0

は...完璧おかげで多くのことを働きました。私は疑問がありますが、パラメータが「スタート」であることをどのように識別しましたか?私にも知らせてください、私も理解することができます。再度、感謝します。 – Jeril

+1

@Jerilこれは、基本的に基本的に最初からオフセットされており、 'count * page_number 'として一般化することができます。' page_number'は0から始まります。つまり、count = 15の場合、最初のページはstart =秒:スタート= 15,3:スタート= 30など。 – alecxe

+0

ありがとう@alecxe ...あなたは素晴らしいです... – Jeril

関連する問題