0
私たちはインデックス作成のニーズに合わせてHDFSでSolrを使用しています。私たちのパフォーマンスランで既存のドキュメントを更新している(既存のドキュメントとアップデートを読む)と、HDFSストレージスペースが急激に増加していることがわかりました。ここで述べた標準設定(https://cwiki.apache.org/confluence/display/solr/Running+Solr+on+HDFS)を使用しています。私たちの問題の根本原因となるものの手がかりは?ご協力いただきありがとうございます。Solrでドキュメントを更新する際に、hdfsスペースが大幅に増加しています
大声で考えてみましょう:既存のドキュメントを更新する前に削除する必要がありますか?すなわち、既存の読み取り、新しい文書の構築、既存の文書の削除、更新を行う。ストレージについて言及したので指摘してください。 – chinglun
Solrはそれを自動的に行います。手動で削除する必要はありません。 SolrがHDFSと統合されている場合にのみ、この問題が発生します。別のファイルシステムでうまくいきました。 – geekprogrammer
クリーンアップは有効になっていますか? – chinglun