2016-11-10 9 views
1

レビューは複数のクラス "row _3wYu6I _3BRC7L"でセレクタにあります。 しかし、スクレイプするとき、レスポンスには上記のセレクタがありませんが、代わりに "row _3wYu6I _1KVtzT"セレクタがあります。このセレクタには空のリストがあります。実際に、flipkartページFlipkart pageに "_3BRC7L"という値を持つすべてのクラスは、 _1KVtzT "というメッセージが表示されます。 The list of elements that I get when using xpath of the parent class。この問題をどのように解決すればよいですか?ウェブスクレイピング用のflipkartレビューページから正しいセレクターを取得するにはどうすればよいですか?

+0

コードを表示しますか?これらのクラス '_3BRC7L'、' _1KVtzT'がページロードごとに異なるランダムに生成された値であるかどうかチェックしましたか? –

+0

はい、そうです、彼らはランダムに生成された値です。今すぐコードを修正しました。ありがとうございます –

答えて

1

flipkartページでは、ajaxリクエストによって動的コンテンツが生成されます。そのため、正しいクラスセレクタを取得できませんでした。今度は、次の回答の指示に従ってコードを変更しました:To retrieve data through ajax requests。 私はスクレイピングに慣れていないので、私はとても役に立ち、シンプルであり、私はスクラピーやカスペルスを使用する必要はありません。

0

xpathを使用すると、値reviewを含むidの段落を含む特定のクラスのdivを取得できます。

このセレクタは非常に良いスタートです。ここからレビューのためのセレクタを作成できます。

//div[.//p[contains(@id, 'review')]][@class='col'] 
+0

私はxpathを与えようとしました。しかし問題は、現在、flipkartがダイナミックコンテンツを生成していることです。スクレイピングすると、htmlページで正しいセレクタが使用されていません。そこで、私はページのajaxリクエストを使ってデータを取得しました。 –

関連する問題