どのようにしてすべての固有リンクのサイトをクロールし、そのドメインのルートにXMLファイルを作成/書き込みできますか?私はmydomain.com/generatesitemap.phpを呼び出すときのようなものが必要です。そして、このファイルはドメイン内のすべてのリンクをクロールし、ファイルsitemap.xmlに書き込みます。これはPHPでcURLで可能ですか?PHPの動的サイト用のSitemap.xmlファイルの生成
0
A
答えて
0
サイトによって異なります。単純なサイトの場合は、タスクは簡単です。 curlまたはfile_get_contentsを使用してサイトのルートページを取得し、すべてのリンクをpreg_matchし(参照番号http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/を参照)、サイト内のすべてのリンクを再帰的に取得して、すでに処理されているリンクを処理しない。
JavaScriptが再生されると、タスクが複雑になります。ナビゲーションでJavaScriptデータを使用すると、リンクを取得するのが難しくなります。ドロップダウンメニューとしてselect-comboboxのような他のナビゲーショントリックがあるかもしれません。
クエリ文字列を含むページがあると、タスクがさらに複雑になる可能性があります。カタログセクションがあるとします。 URLは次のようなものです:
/catalogue
/catalogue?section=books
/catalogue?section=papers
/catalogue?section=magazines
1ページですか?
これはどうですか?
/feedback
/feedback?mode=sent
このような場合は注意してください。
Google検索には、このようなクローラの例がたくさんあります。たとえば、これを見てください。
関連する問題
- 1. 動的にsitemap.xmlを生成する
- 2. 動的PHPの生成
- 3. .docファイルの動的生成
- 4. PHPの動的Webサイト
- 5. PHPのfile_put_contents、日付に応じたファイル名の動的生成
- 6. サードパーティのライブラリを使用してPHPでSiteMap.xmlを生成するには?
- 7. 動的CSSのPHP関数を生成
- 8. PHPで動的フォームの生成
- 9. PHPが動的生成ファイルのファイルコンテンツを取得する
- 10. Twistedを使用して動的にサイトを生成
- 11. dribbble.comのような動的PHPサイト
- 12. 動的コンテンツを持つサイトのPHP
- 13. phpMailer用の動的HTMLの生成
- 14. ここで私はRobots.txtファイルとsitemap.xmlファイルをPHPのWebサイトに置いていますか?
- 15. PHPで動的QRコードを生成
- 16. サブドメイン上のnginx substitudeファイルsitemap.xml
- 17. PHPを使用して動的に生成されたファイルをダウンロードする
- 18. 動的コンテンツ用のPdf生成
- 19. AJAX-PHP-MySQL生成テーブルの動的Divタグを作成
- 20. AngularJS + Spring MVC Webサイト用の静的SEOページを生成
- 21. PHPでWebサイト用の設定ファイルを作成する
- 22. PHP動的スプライトの作成
- 23. 動的HTMLファイルを生成する
- 24. JMail.AddURLAttachment動的に生成されたファイル
- 25. .aspx生成ファイルを自動的にダウンロード
- 26. sitemap.xmlサイトを作成できません10000ページはcodeigniterを使用
- 27. 動的なHTMLチェックボックスをPHPを使用して生成
- 28. Javascriptを使用してPHPコードを動的に生成
- 29. 動的レポートの生成
- 30. イメージの動的生成グリッド