Javaで複数の子ノードとエッジをサポートするツリーを作成しました。私は今までこのアプリケーションをスケールアップすることについて心配する必要はありませんでした。ユース・ケースでは、ツリーの100以上のインスタンスが検索および維持される必要があります。Javaベースのツリーのスケーリング
私はこのドメインで非常に最小限の研究を行っています。気になる最初のものはスパークです。私がそれを理解する方法は、Sparkがイベントのウィンドウをバッチ処理することです。ここでは時間が非常に重要です。
私はHadoopのファイルシステムを利用することを考えていました。クラスタ全体でツリーを索引付けし、MapReduceを使用してメンテナンスを行います。
私はよく読んでも構いません。記事、チュートリアル、または推奨事項があれば、それは非常に感謝します。
乾杯