2011-06-23 10 views
0

私のレベルのフラストレーションは、Dokuwikiのサイトをクロールすることによって最大限に向上しています。

私は、dokuwiki/doku.phpサイトをクロールするように設定したSharePoint用のFAST検索を使用するコンテンツソースを持っています。クローラルールは次のように設定されます。http://servername/ *、大文字と小文字を区別し、このパス内のすべてのアイテムをクロール複雑なURLとともに含めます。クロールルールでコンテンツソースをテストすると、クローラによってクロールされます。しかし、.....クロールは常に2分以下で終わり、私が指しているページだけをクロールして、そのページには他のリンクはありません。私はDokuwkiの管理者に確認し、ロボットのテキストを許可するように設定しています。ページのソースを見ると、 メタ名= "robots" content = "index、follow"と表示されていることがわかります。他のリンク先ページに問題がないことをテストするために、手動でコンテンツの源泉へのリンクと再クロール..例のソースページには3つのリンクFAST Search for Sharepoint Dokuwikiのページでのクローラの問題

  • サイトA
  • サイトB Iが追加
  • サイトC.

サイトA、BおよびCウルを持っていますクロール元に転送します。このクロールの結果は、4つの成功、プライマリsouceページ、およびその他のリンクA、B、およびC iが手動で追加されたものです。

私の質問はなぜクローラがページ上のリンクをクロールしないのですか?私が最後にクローラでやる必要があるのでしょうか、それとも名前空間がどのように定義され、リンクがDokuwikiで構築されたかと関係していますか?

すべてのヘルプは

をいただければ幸いエリック

答えて

0

あなたが遅延インデックスオプションとrel = nofollowのオプションを無効にしましたか?

0

FASTクロールログでの認証の問題が報告されていないにもかかわらず、認証に関する問題が発生しました。 この修正により、検索インデックスサーバーのIPアドレスに$ freepass設定が追加され、Appacheが各ページヒットの認証プロセスを通過しなくなりました。返信用

おかげ

エリック