更新: Pysolrバージョン:3.2.0pysolr更新文書が
これはSolrの中にバグが考えられます。操作で何も更新しないと、この文書は削除されます。
元私はusing pysolr in atomic updateにコードを使用しましたが、以下のケースでエラーが発生しました。
は今、多分、このような文書スキーマ:
doc = {
'id': ...,
'title': ...,
'body': ...,
}
私は、ドキュメントのバッチをインデックス化しているし、今は新しいフィールドanchor_textですべてのドキュメントを更新したいです。ここに私のコードです:
solr = pysolr.Solr(url_solr)
doc_update = {
'id': ...,
'anchor_text': [a,b,c,...]
}
solr.add([doc_update], fieldUpdates={
'anchor_text': 'set'
})
しかし、私は、元のドキュメントのいくつかののみIDフィールドの左にを取り除いたを発見しました。更新後のこのような 何かを:
doc = {
'id':...
}
特に、そのanchor_textフィールド空のリストであるそれらのために、オリジナルのドキュメントが削除されます。他の人はそうではありませんが(おそらく、私はいくつかのケースしか見ないので推測します)。
私はソースコードを見てきましたが、価値のあるものは何も見つかりませんでした。何が起きてる?
更新文書でピソルバーを使用する正しい方法は何ですか?