サイト内にいくつのパブリックページがあるか、たとえばsmashingmagzine.comなどを知りたいと思います。ページ数を数える方法はありますか?サイト内のページ数をカウントする
2
A
答えて
2
0
各ページのマークアップを再帰的にスキャンする必要があります。トップレベルのページから、他のページへのリンクを探して再帰的にクロールします。無限ループに巻き込まれないようスキャンされたものを追跡する必要もあります。
3
site
演算子を使用してGoogleのインデックスにクエリを実行できます。例:
これは、Googleによって現在インデックスされているページのリストを返します。他の検索エンジンでも同様の機能が提供されていますが、私は構文を理解していません。
もちろん、すべてのページがインデックスに登録されているわけではなく、インデックスには存在しなくなったページが含まれている場合があります。
+0
私はGoogleにすべての苦労をさせるという考えが好きです... –
関連する問題
- 1. ページ内の入力数をカウントする
- 2. ワークシートの印刷ページ数をカウントする
- 3. WordPress:子ページ数をカウントする
- 4. リストリスト内のリストの数をカウントする
- 5. グリッド内の種の数をカウントする
- 6. テキストボックス内のセンテンスの数をカウントする
- 7. イメージ内の円の数をカウントする#
- 8. ディレクトリ内のファイル数をカウントする
- 9. ファイル内の単語数をカウントする
- 10. カテゴリ内の記事数をカウントする
- 11. フォルダ内のフォルダ数をカウントする
- 12. プロローグ内の原子数をカウントする
- 13. Chef:フォルダ内のファイル数をカウントする
- 14. リスト内の数字をカウントするプロローグ
- 15. ボックス内の要素数をカウントする
- 16. テーブル内の行数をカウントする
- 17. XMLファイル内のエントリ数をカウントする
- 18. アセットサブフォルダ内のファイル数をカウントする
- 19. Zipファイル内のファイル数をカウントする#
- 20. サブディレクトリ内のファイル数をカウントするバッチファイル
- 21. ファイル内の行数をカウントする - Scala
- 22. プロジェクト内のXMLファイル数をカウントする
- 23. カウントなしでクエリセット内のアイテム数をカウントする方法
- 24. Wordpress - 複数のページのサイト
- 25. 関数内で3秒をカウントする
- 26. カウント数は、アレイ内のオブジェクト
- 27. スキーム内のリスト内のゼロの数をカウントする
- 28. 複数のdiv内のハッシュタグのカウント数
- 29. Javascript&Cookies:すべてのページの訪問数をカウントする
- 30. 範囲内の数字の複数のインスタンスをカウントする
私が同じドメインにいるかどうかを確認するにはどうすればよいですか? RegEx? –
リンク先のURLのホストを見ることができます。 URLパーサはPHPでこの情報を簡単に取得できます。 –