私は、Javaベースのクローラで作業しています。クローラがクラッシュした場合は、クローラが停止した時点から前回のクロールを開始できるようにする必要があります。クローラアプリケーション用DBシステム
この目的のために、すべてのアウトリンク(任意のページにあるリンク)をデータベースに保存する必要があります。私はどのデータベースが、データベースからのリンクの非常に速い挿入と再登録を必要とし、挿入頻度と再取得頻度が非常に高いような種類のシステムに最適であるかはわかりません。
mongodbのようにno-sqlを提案した人はほとんどいませんが、そのような種類のシステムに最適な選択肢であることを確認したいだけです。