html agility packを使用してWebスクレーパーを作成しています。ページネーションに関する質問があります。 私は、私が進むのを助ける何かを見つけるためにウェブを検索しましたが、私は近くにいません。私はすべてのページ付けされたページの内容をこすりする必要があります。 htmlagilityを使用してそれを行うためのメカニズムはありますか? セレンのような他のアプリケーションも見つけてそれを調べました。私はhtmlagilityと共にセレンを利用することができる方法はありますか? どんな種類の助けでも大歓迎です。 ありがとうございましたHtmlAgilityPackを使用したページ番号付けページのページ
-1
A
答えて
1
確かに、セレンと一緒にHAPを使用することができます。基本的に、あなたはセレンドライバのいずれかを使用してURLに移動し、HAP、次のようなものの中にHTMLを読み込むことができます。
IWebDriver driver = new FirefoxDriver();
driver.Navigate().GoToUrl(url);
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(driver.PageSource);
あなたは現在のページを解析を終えた後、次のページにドライバをナビゲート(次のページリンクを見つけてクリックアクションを実行します)、HTMLを再びHAPに渡します。とにかく、ほとんどのHAP機能はSeleniumに置き換えることができると思いますので、Seleniumのみを使用することを検討してください。
関連する問題
- 1. PHPのページ番号付けページのリンク
- 2. Joomla K2は、ページ番号にページ番号を付け加えてページ番号を変更します。
- 3. ページ番号を付け加えたページのページ番号を追加するWordpress、Yoast
- 4. cakephpページ番号付きのページ分割
- 5. PHP&MS SQL Serverを使用してURLにページ番号を送信せずにページ番号を付けよう
- 6. データのページ番号付け:java + oracle sql
- 7. CouchDBのページ番号付けとソート
- 8. 角材のページ番号付け次のページの機能
- 9. with_exclusive_scopeを使用したページ番号
- 10. jqueryを使用したページ番号
- 11. TopScoreDocCollectorを使用したLuceneページ番号
- 12. get_postsを使用したWordpressページ番号
- 13. Codeigniterデータモデルを使用したページ番号
- 14. 最初のテーブルのページ付け2番目のテーブルとの競合 - ページ番号
- 15. javacriptとphpを使用したテーブルのページ番号付けとフィルタリング
- 16. SQL ServerとPHP(foreachメソッド)を使用してページ番号付けで各ページの番号付けを続ける方法
- 17. ページ番号を使用して
- 18. インデックス2つのビューモデルを使用している場合のページ番号付け?
- 19. Woocommerceのページ番号付け - ページ1の301リダイレクトを防止する
- 20. CakePHP:番号が付けられたページ区切りの結果
- 21. Codeigniterページ番号
- 22. Wordページ番号
- 23. SSRSページ番号
- 24. HTML5ページ番号
- 25. rich:dataScrollerページ番号
- 26. ActiveResourceページ番号
- 27. Symfony 1のページ番号付け結果を注文します
- 28. サーバ側のページ番号付けと角度付き
- 29. アクセスレポートの表紙のページ番号をスキップし、2番目のページの新しいページ番号をグループ別に
- 30. (Gallerific)ページ番号と矢印のスタイル設定と位置付けページ:
確かにHtmlAgilityページを使用して、ページネーションリンクを含むページ上のすべてのリンクを取得できますが、あなたの質問は広すぎて答えられません。何を試しましたか? HtmlAgilityパックを使用してウェブサイトをクロールする例は次のとおりです。http://blog.abodit.com/2010/03/a-simple-web-crawler-in-c-using-htmlagilitypack/ –
イアンさん、ありがとう、私はHAPを利用していますウェブサイトを擦っていましたが、私はページネーションでそのことを実現しませんでした。だからちょうど新鮮なアイデアを得たいと思った – shunilkarki
ページネーションはしばしばあなたが探検するように進化するリンク(1 2 3 ... n)の束として実装されます(... 4 5 6 ...) ? –