多くの検索の後、Nutch 1.3とSolrの使い方の簡単な説明はありません。単純なNutch 1.3/Solrのインデックスの説明
私は検索のためにウェブサイト上で使用する他のコンテンツと一緒にSolrインデックスを持っています。
Nutchの結果をインデックスに追加して、ウェブサイトの検索に外部サイトを追加したいとします。
これはすべてうまくいきます。
質問はどのようにインデックスを更新しますか?あなたはまずソルからナッチの結果をすべて削除しなければなりませんか?あるいは、Nutchはそれを世話しますか? NutchはSolrインデックスから有効ではなくなった結果を削除しますか?
これらの質問に答えることは、ドキュメントや説明がないシェルスクリプトでは役に立ちませんでした。
クロールされたWebサイトに登録されていないドキュメントはどのように整理されますか? – Karl
これはデフォルトでは起こりません。これを達成するには、サイトのすべての結果をインデックスから削除し、次に更新クロールを実行する必要があります。リフレッシュクロールが完了するまで結果が得られるように、solrインデックスに新しいデータをサブミットする直前に削除を実行できます。 – Umar
これはナッチができることですか?私は索引から物を削除することについて何も見ていない。 – Karl