elasticsearchでデータセットを一括インデックスするスクリプトを作成しました。ただし、異なるサーバー上の同じデータセットで同じスクリプトを実行すると、実行時間が異なることが意図されています。 SSDを搭載したサーバーでは、200万の文書は10分以内に索引付けされますが、通常のハードディスクの場合は完了までに最大1時間かかります。減速の原因を突き止めるために使用できる診断ツールはありますか?elasticsearchで低速インデックスの理由を調べる
いくつかの追加情報:
- スクリプトのpython3のために書かれ、バルクインデキシング
- ためelasticsearch-PYモジュールを使用している両方のサーバが同じオペレーティングシステム(Ubuntuの14.04 LTS)とのいずれかを実行し低速のハードディスクには64GBのRAMが搭載されていますが、SSD搭載のRAMにはRAMの半分があります。
インデックス作成のパフォーマンスに関しては、[SSDは回転ディスクより高速です](https://www.elastic.co/guide/en/elasticsearch/guide/current/indexing-performance.html#_storage)です。 – Val
しかし、その違いは非常に重要です。理由を知りたいのですが、どこから始めるのか分かりません。 – Jeffrey04