アパッチGiraphは:トラバーサルアルゴリズム論文2つのグラフ処理システムでは全く異なるノード間でていますか?我々は、単一のマシン(分散されていない)に格納されたデータにGiraphとNeo4jを使用してソーシャルグラフを言うと、より良い結果を出すことができました。なぜですか?のNeo4j <em>のNeo4j</em>対
12
A
答えて
22
手を下ろすNeo4j。 Giグラフのグラフ計算は、大規模な分散グラフで動作するため、Hadoopジョブとして実行されます。これらのジョブを管理するオーバーヘッドは大きすぎるため、擬似分散された単一マシン・クラスター上で実行される小規模なグラフでは効率的ではありません。
だけでなく、Neo4jの専門はトラバーサルです。その大きな理由は、Neo4jが実際に隣接する関係をファイルシステムの二重リンクリストに格納するためです。それはのNeo4jは、彼らがそのような横断などの高速グラフの操作のためのグラフを、保管方法を最適化する方法を説明し
http://digitalstain.blogspot.nl/2010/10/neo4j-internals-file-storage.html
:このブログのエントリをチェックしてください。
関連する問題
私はこの回答に同意します。 Neo4jは、中小規模のデータセット(数百万ノード/リレーションシップ)でデータのリアルタイム分析を行うことを目的としていましたが、giraph/pregelはインターネット規模のトラバースで大規模な分散作業を行うためのものでした。 – Nicholas