nodejsは私のために新しく、私はちょうどウェブスクレーパーを学び始めました。問題は、JSで保護されているウェブサイトをスクラップする必要があることです。だから、私はウェブサイトから電話を入手する必要がありますが、電話番号を表示するdivは、ユーザーが「番号を表示」ボタンをクリックした後にのみ表示されます。番号を取得する方法やnpmはありますか?ここにはウェブサイトenter link description hereがありますが、それはロシア語です。ボタンは "показатьтелефоны"です。前もって感謝します!Nodejs JS保護されたウェブサイトを読むことができるスクレーパーを書く
0
A
答えて
1
電話番号のページに移動してコンソールを開き、ネットワークツールを確認します。あなたが電話番号をクリックすると、それは、Ajaxリクエストを行い、あなたに素敵なフォーマットされた応答ページをこするした後、あなただけの正しいパラメータを持つhttp://api.all.biz/ajax/viewphonenew/kzエンドポイントへの呼び出しを行う必要があり、これをエミュレートするために
{"status":"ok","phone":"+7 (727) 317-20-86","html_tooltip":"<section class=\"company-phones-tooltip\">\r\n <div class=\"company-phones-tooltip__wrap\">\r\n <header class=\"company-phones-tooltip__header\">\r\n Inform the manager that you learned the information on Allbiz.\r\n <\/header>\r\n <ul class=\"company-phones-tooltip-list\">\r\n <li class=\"company-phones-tooltip-list__item\">\r\n <div class=\"company-phones-tooltip-list__name\">\r\n management\r\n <\/div>\r\n <div class=\"company-phones-tooltip-list__number\">\r\n +7 (727) 317-20-86\r\n <\/div>\r\n <\/li>\r\n <\/ul>\r\n <footer class=\"company-phones-tooltip__footer\">\r\n <a class=\"company-phones-tooltip__link\" href=\"https:\/\/12246-kz.all.biz\/contacts\" target=\"_blank\">\r\n Show all contacts\r\n <\/a>\r\n <\/footer>\r\n <\/div>\r\n<\/section>"}
を与えます。このエンドポイントに必要なすべてのクエリパラメータは、html要素にあります。
<div class="company-phones__wrap" data-click="company-phones" data-entid="58474" data-verify="bYjmFpAfm5QWOgIjx8cyNOARdSG3FIoPo6he2dYGLIc=" data-phone="Zk6xDyCXPMqWMXgTaCI51A24FHIsDwuy8IaF993LsHI=" data-country="kz" data-placement="company-phones-tooltip___3" data-tooltip-direction="left" data-source="list">
<div class="company-phones__code">+7(7 </div>
<div class="company-phones__main" data-ga="show-phones-list" data-ga-id="">
<div class="company-phones__btn">Показать телефоны</div>
</div>
</div>
+0
あなたの答えをありがとう、私はそうしようとしましたが、 "エラー要求" –
+0
この方法を試してみましたか?それはあなたのために働いたのですか?多分私は何かを間違った –
関連する問題
- 1. 検証されたクライアントだけが読むことができるようにデータを保護する
- 2. クロールパスワードで保護されたウェブサイト
- 3. ランダムエラー:保護されたメモリを読み書きしようとしました
- 4. System.AccessViolationException:保護されたメモリを読み書きしようとしました
- 5. 保護されたメモリを読み書きしようとしました
- 6. パスワードで保護されたXLSXをPerlでLinux(とwindows)で読む
- 7. 保護されたPDFから添付ファイルを読む
- 8. レールでユーザ名とパスワードで保護されたリモートファイルを読む方法3
- 9. Shiro:@RequiresRolesで保護されたエンドポイントのテストを書くには?
- 10. NodeJs:ファイルを書き込むことができません
- 11. Rを使用して保護されたSharepointサイトにファイルを書き込む
- 12. NodeJSで書き込まれているオーディオファイルを読む
- 13. 隠された保護されたWord文書からテキストを読む(C#を使用してプログラム的に)
- 14. Apacheからの読み取りはできますが、Apacheのセキュリティで保護されたディレクトリに書き込むことはできません。
- 15. パスワードで保護されたシートでExcelを読む。ワークブックのパスワードを保存しなくても、もはや
- 16. 読むパスワード保護されたワークシート(バージョン - エクセル95,97-2003)は、Java
- 17. Rails CSFRの保護:before_filterを書くことはcorrentですか?
- 18. ウェブサイトのコードを保護する方法PHP/JS?
- 19. プラットフォームの呼び出しエラーが保護されたメモリを読み書きしようとしました
- 20. System.AccessViolationException: '保護されたメモリを読み書きしようとしました。 (C++のlibのラッパーを作る)
- 21. ローカルに保存されたイメージをコレクションビューにすばやく読み込むことができません。
- 22. パワーBIパスワードで保護されたウェブサイトに公開する
- 23. Macで読むことができるログを書き込む方法
- 24. SimplePieを使用してワードプレスパスワード保護されたフィードを読む方法
- 25. パスワードで保護されたPPTとPDFを開くには
- 26. SVNが書き込み保護されたディレクトリを無視する方法を教えてください。
- 27. C#でパスワードで保護されたSQLite 3データベースを開くことができません
- 28. SKSafariViewController iOSで保護されたpdfを開くことはありません
- 29. Chromeキオスクモードのセキュリティで保護されたウェブサイト
- 30. 保護されたメモリを読み書きしようとしました - .NET EF + Web API
あなたはそれが動的に生成されたデータを使用しているサイト上で動作します。..スクレイピングを行うには、セレンのようなツールを使用したいとしてだけでなく、データ入力や仮想マウスの相互作用を使用してサイトと対話しています。 – zipzit