バルクAPIを使用してelasticsearchにドキュメントとしてapache logrowsを追加するためにcurlを使用しています。elasticsearchバルクAPIのすべてのドキュメントのインデックスを避ける方法
{"index": {"_type": "apache", "_id": "123", "_index": "apache-2017-01"}}
{"s": 200, "d": "example.se", "@t": "2017-01-01T00:00:00.000Z", "p": "/foo"}
{"index": {"_type": "apache", "_id": "124", "_index": "apache-2017-01"}}
{"s": 200, "d": "example.se", "@t": "2017-01-01T00:00:00.000Z", "p": "/bar"}
... more of the same ...
私の推測では、すべてのlogrow文書のLuceneインデックスは、それのインデックスを更新行ということです:私は、次のポスト。しかし、私はそれを行うためにelasticsearchを必要としません。私は、すべてのログロードドキュメントを最初に追加した後、インデックスを更新しても問題ありません。
これは可能ですか?それは良いアイデーですか?それはパフォーマンスを劇的に改善するでしょうか?
バルクAPIの全体的なポイントは、効率的な方法でインデックス/削除操作の束を実行することです。なぜElasticsearchが非効率的にそれをやっていると思われますか? – femtoRgon