2017-03-22 7 views
0

私はウェブサイトのインデックスにnutch V2を使用しています。 しかし、もはや存在しないページ(私はCMSをインデックスに登録しているので、ページは削除できます)はSOLRインデックスから削除されません。nutch V2(solr付き)文書を削除する

私はdb.update.purge.404=trueを私のnutch-default.xmlに設定しようとしましたが、それは何もしていないようです。

nutch V1の場合、コマンドラインパラメータ「-deleteGone」が存在することがわかりましたが、ドキュメントからはV2で削除されたとしか推測できません。

私の質問は、どのようにnutch V2が存在しないURLを削除するように設定するのですか?

答えて

2

あなたがいないnutch-default.xml

で、 nutch-site.xmldb.update.purge.404=trueを設定する必要があります
関連する問題