検索エンジンのボットは何を出発点として使用しますか?それはDNSルックアップですか、それともよく知っているサイトの固定リストから始まっていますか?推測や提案はありますか?検索エンジンはどこからクロールを開始しますか?
答えて
あなたの質問は二つの方法で解釈することができます。検索エンジンは、一般的に自分からクロールを開始、またはそれらが特定のサイトをクロールを開始どこどこ
を求めていますか?
大きなプレーヤーの仕組みはわかりません。独自の検索エンジンを作ろうとすれば、おそらく人気のあるポータルサイトを使って検索エンジンを設定するだろう。 DMOZ.orgは人気の高い出発点のようです。ビッグプレーヤーは私たちよりもはるかに多くのデータを持っているので、おそらくさまざまな場所からクロールを開始します。
SEが特定のサイトのクロールを開始する場所を尋ねる場合、おそらくあなたのページのうち最も人気のあるページと関係があります。多くの他のサイトがリンクしている1つのスーパーポピュラーなページがあれば、他のサイトからのエントリポイントが非常に多いため、SEのスタートページが表示されます。
私はSEOなど何でもないことに注意してください。私はちょうど私が取り組んでいるプロジェクトのためにしばらくの間、ボットとSEのトラフィックを勉強しました。
site submission formsを使用して検索エンジンにサイトを送信することができます。これにより、あなたのシステムにアクセスできます。あなたが実際に言うことは不可能な後に実際にクロールするとき - 経験から、それは通常、最初のクロール(ホームページ、いくつかの他のページがそこから1リンク深い)のために約1週間かかります。明確な意味論的リンク構造を使用してクロールおよび索引付けされるページの数を増やして、sitemapを提出することができます。これらを使用すると、すべてのページをリストし、相互に重み付けすることができます。サイトの各部分は他の部分と相対的です。
サイトが他のクロールされたウェブサイトからリンクされている場合は、リンクされたページからクロールされ、最終的に他のサイトにも広がります。これは長い時間がかかり、リンクサイトのクロールの頻度に依存するため、URLの提出はGoogleがあなたのことを知る最も簡単な方法です!
私は十分に高く推奨できないツールの1つがGoogle Webmaster Toolです。これは、あなたがクロールされた頻度、googlebotが遭遇したエラー(壊れたリンクなど)、その他の便利なツールのホストがそこにあるのを見ることを可能にします。
原則として、何もしません。誰かが自分のウェブサイトを含めるよう明示した場合にのみ、このサイトのクロールを開始し、そのサイトのリンクを使用してさらに検索することができます。
しかし、実際には、検索エンジンの作成者は、彼らが考えることができる任意のサイトを配置します。たとえば、自分のブログや自分のブックマークにあるサイトなどです。
理論上、ランダムなアドレスを選んでそこにウェブサイトがあるかどうかを知ることもできます。私は誰もこれをやっているとは思わない。上記の方法はうまく動作し、検索エンジンをブートストラップするために余分なコーディングを必要としません。
- 1. ホームページからのリダイレクトは検索エンジンのクロールに影響しますか?
- 2. asp.net mvc検索エンジンのクロールからアクションを除外する
- 3. AJAXサイトは検索エンジンによってクロール可能ですか?
- 4. バイナリ検索ツリーはどこから始めるのですか?
- 5. いずれの検索エンジンも検索データを公開していますか?
- 6. のEmacs:I-検索開始検索バッファの初めから
- 7. 開始文から単語を検索するには
- 8. どのような検索エンジンを使用しますか?
- 9. getResourceAsStream(file)はファイルをどこから検索しますか?
- 10. 防止インデックススクリプトのURLから検索エンジン
- 11. この方法では、これらのページを検索エンジンで索引付けしますか?
- 12. Google検索エンジンの前の検索エンジン
- 13. PHP、glob()関数はファイルの検索をどこから開始するのですか?
- 14. R sub with perl - 後方検索を開始しますか?
- 15. 検索エンジンを使用してローカルデータベースから文書を検索する
- 16. Javaプログラミングを開始するには、どこから始めますか?
- 17. 検索エンジンがウェブサイト全体をクロールするのを止めるには?
- 18. 私のウェブサイトの訪問者は検索エンジンから来ていますか?検索用語は何ですか?
- 19. 検索エンジンは引用でのクエリを分析しますか?
- 20. PHP - 配列の出現を検索して、ここで開始
- 21. アクティビティからGoogle検索クエリを開始 - Android
- 22. 正規表現検索をサポートする検索エンジンはありますか?
- 23. Elastic検索を開始する必要がありますか?
- 24. 検索エンジンからトラフィックマネージャのエンドポイントを非表示にしますが、カスタムドメインを公開します
- 25. あるポインタから始まり、どこから開始するループを作ることができますか?
- 26. mongodbはどんな検索エンジンを使用していますか?
- 27. 検索エンジンはフラットリンクをどのように発見しましたか?
- 28. Django:検索エンジン
- 29. 検索エンジン - PHP
- 30. Lucene.net検索エンジン
この質問はプログラミングに関するものではないので、話題にはならないようです。ヘルプセンターの[ここではどのトピックを参照できますか](http://stackoverflow.com/help/on-topic)を参照してください。おそらく、[Web Apps Stack Exchange](http://webapps.stackexchange.com/)がより良い場所になるだろう。 – jww