Googleのnグラムから収集したデータを使ってデータベースを作成しようとしています。実際には大量のデータですが、CSVファイルを作成した後は挿入がかなり高速でした。問題は、挿入直後にneo4j-import
ツールがデータにインデックスを付けることであり、このステップは時間がかかりすぎるということです。 1時間以上経過しており、進捗状況の10%を達成したようです。.CSVファイルをNeo4jでバッチ挿入すると、ソートとインデックスに膨大な時間がかかります
Nodes
[*>:9.85 MB/s---------------|PROPERTIES(2)====|NODE:198.36 MB--|LABE|v:22.63 MB/s-------------] 25M
Done in 4m 54s 828ms
Prepare node index
[*SORT:295.94 MB-------------------------------------------------------------------------------] 26M
これはコンソール情報atmです。誰もこのプロセスをスピードアップするために何をすべきかについての示唆を持っていますか?
ありがとうございます。 (: