私は大規模なグラフ(500million +ノード)に関係の変化番号を挿入するためのNeo4jのBatchInserterを使用していのNeo4j BatchInserter遅いシャットダウン
それは毎分関係の多くの千年代を挿入する、非常に高速です。
シャットダウンは非常に遅く、少数のリレーションシップが挿入されていても1時間以上かかっています。
org.neo4j.unsafe.batchinsert.BatchInserterImpl.shutdown()
の内側に見て、私がいることを、私はそう長く取っているシャットダウンのどの部分かわからないが、私は事実を知っていればrepopulateAllIndexes()
含めて、それがない操作の数があることがわかり新しい関係はどのインデックスにも影響しません。BatchInserterImpl
をサブクラス化し、これらのシャットダウン操作をスキップするのに価値がありますか?
この段階では、ディスクへのフラッシングがたくさんあります。プロセス(たとえばYourKit)にプロファイラを添付して、実際に時間が費やされている場所を確認することをおすすめします。 –