グラフデータベースとグラフ処理フレームワークの違いは、データ間の関係がエッジで構築され、データポイントがノード/頂点で構築されるグラフの基本形式でデータを保存するためのデータベースです。 OrientDBのような一部のデータベースは、この基本概念をかなり拡張して、データベースをより汎用性のあるものにします。他はあまり汎用性がありません。一般的に、主な目的は、データをグラフのような形、辺、頂点に維持することです。
一方、グラフ処理フレームワークでは、一連のデータを取り込み、データから分析グラフを構築します。目標は、主にデータ内のパターンまたは構造のようなグラフの分析です。
これを私が理解しているように類推に入れようとします。
パンチ(あなたのデータ)がいっぱいのパンチボウルがあるとします。
グラフデータベースのシナリオでは、パンチはすでにグラフになっていますので、ボウルを見て、グラフ内のすべてのものを見て分析することもできます。
グラフ処理フレームワークでは、パンチボウルもいっぱいですが、それは暗いですし、直接グラフが表示されません。いくつかのタイプのグラフを取得するには、まずパンチの一部を取り除く必要があります。たとえば、「グラフ処理レードル」です。これにより、データを試して分析するアルゴリズムに応じて、ある種のグラフの一貫性を見ることができます。もちろん、機械やシステムによっては、スパークのように、グラフ加工用の取鍋は、パンチボウル全体またはそれ以上の大きさであっても、巨大である可能性があります。
まだ、パンチ(あなたのデータ)から「感知可能なグラフ」を作成するには時間と処理が必要です。これについてのもう一つのことは、分析されたグラフパンチのこの新しく発見された取鍋を保管したい場合、それを入れるために別のボウルを持たなければならないということです。そして、取鍋を床に落とすと、 。これはグラフデータベースでは起こりません。
私はそれが理にかなっていると思います。
Scott
ありがとうございます!これは素晴らしいアナロジーであり、その違いを明確に理解するのに多くの助けになります。あなたの例から、グラフデータベースはより汎用的で、データを直接分析することもできるので、なぜGraphXのようなグラフ処理フレームワークが最近普及しているのでしょうか?なぜ人々は単にグラフデータベースにデータを入れてグラフを作成する時間を節約しませんか? – Dong
彼らはパンチボウルに非グラフパンチがあるので、より一般的です。 –