レビューは複数のクラス "row _3wYu6I _3BRC7L"でセレクタにあります。 しかし、スクレイプするとき、レスポンスには上記のセレクタがありませんが、代わりに "row _3wYu6I _1KVtzT"セレクタがあります。このセレクタには空のリストがあります。実際に、flipkartページFlipkart pageに "_3BRC7L"という値を持つすべてのクラスは、 _1KVtzT "というメッセージが表示されます。 The list of elements that I get when using xpath of the parent class。この問題をどのように解決すればよいですか?ウェブスクレイピング用のflipkartレビューページから正しいセレクターを取得するにはどうすればよいですか?
1
A
答えて
1
flipkartページでは、ajaxリクエストによって動的コンテンツが生成されます。そのため、正しいクラスセレクタを取得できませんでした。今度は、次の回答の指示に従ってコードを変更しました:To retrieve data through ajax requests。 私はスクレイピングに慣れていないので、私はとても役に立ち、シンプルであり、私はスクラピーやカスペルスを使用する必要はありません。
0
xpathを使用すると、値reviewを含むid
の段落を含む特定のクラスのdivを取得できます。
このセレクタは非常に良いスタートです。ここからレビューのためのセレクタを作成できます。
//div[.//p[contains(@id, 'review')]][@class='col']
+0
私はxpathを与えようとしました。しかし問題は、現在、flipkartがダイナミックコンテンツを生成していることです。スクレイピングすると、htmlページで正しいセレクタが使用されていません。そこで、私はページのajaxリクエストを使ってデータを取得しました。 –
関連する問題
- 1. ハッシュセット<string>から正しいケース値を取得するにはどうすればよいですか?
- 2. Tweepyから正しい日時を取得するにはどうすればよいですか?
- 3. StackTraceから正しい行番号を取得するにはどうすればよいですか?
- 4. XPから正しい行を取得するにはどうすればよいですか?
- 5. -captureStillImageAsynchronouslyFromConnection:completionHandler:から取得したCMSampleBufferからNSImageを取得するにはどうすればいいですか?
- 6. meshgridからノード数を正しく取得するにはどうすればよいですか?
- 7. Androidスイッチから値を正しく取得するにはどうすればよいですか?
- 8. iTunes APIからデータを正しく取得するにはどうすればよいですか?
- 9. .htaccessの正規表現でURLから%20を取得するにはどうすればよいですか?
- 10. ネストされたレデューサーから再選択セレクターをテストするにはどうすればよいですか?
- 11. URLDownloadToFileがキャッシュから取得できないようにするにはどうすればよいですか?
- 12. 複数の条件で正しい値を取得するにはどうすればよいですか?
- 13. このクエリを正しい形式で取得するにはどうすればよいですか?
- 14. GoogleアクションSDKで正しいタイプの引数を取得するにはどうすればよいですか?
- 15. savefiledialogからフルパスを取得し、 "startInfo.Arguments"で使用するにはどうすればよいですか?
- 16. WCFサービスのWSDLに正しいschemaLocationを取得するにはどうすればよいですか?
- 17. BlackBerryですばらしい透明なPNGを取得するにはどうすればよいですか?
- 18. 正規表現を使用してリンクを取得するにはどうすればよいですか?
- 19. PHPを使用してmySQLから値NULLを取得するにはどうすればよいですか?
- 20. selenium-pythonを使用してダイアログからテキストを取得するにはどうすればよいですか?
- 21. PHPを使用してHTMLファイルからメタデータを取得するにはどうすればよいですか?
- 22. carrierwaveを使用してrails-apiからファイルを取得するにはどうすればよいですか?
- 23. rsyncを使用してHTTP URLからファイルを取得するにはどうすればよいですか?
- 24. Gremlinを使用してNeo4jからランダムサンプルを取得するにはどうすればよいですか?
- 25. LibGit2Sharpを使用してファイルバイナリデータをGitリポジトリから取得するにはどうすればよいですか?
- 26. PyQueryを使用してテーブルからテキストを取得するにはどうすればよいですか?
- 27. LiferayからAPIを使用してコンテンツを取得するにはどうすればよいですか?
- 28. QueryDefを使用してパススルークエリからデータを取得するにはどうすればよいですか?
- 29. ビューを使用してアダプタからインデックスを取得するにはどうすればよいですか?
- 30. マルチスレッドを使用してGmailサーバーからメールを取得するにはどうすればよいですか?
コードを表示しますか?これらのクラス '_3BRC7L'、' _1KVtzT'がページロードごとに異なるランダムに生成された値であるかどうかチェックしましたか? –
はい、そうです、彼らはランダムに生成された値です。今すぐコードを修正しました。ありがとうございます –