0
私はウェブサイトのインデックスにnutch V2を使用しています。 しかし、もはや存在しないページ(私はCMSをインデックスに登録しているので、ページは削除できます)はSOLRインデックスから削除されません。nutch V2(solr付き)文書を削除する
私はdb.update.purge.404=true
を私のnutch-default.xml
に設定しようとしましたが、それは何もしていないようです。
nutch V1の場合、コマンドラインパラメータ「-deleteGone」が存在することがわかりましたが、ドキュメントからはV2で削除されたとしか推測できません。
私の質問は、どのようにnutch V2が存在しないURLを削除するように設定するのですか?