2016-07-20 13 views
0

Titanに追加される314mのレコードがあります。バックエンドとしてDynamoDBテーブルを使用してAmazon Titanを操作すると、約10%のデータが125のうち1つのパーティションに配置されていることに気づきました。Amazon Titan:データがDynamoDBパーティションに不均等に分散されています

この不均一な分布は、この不均等な分配の理由は何でしょうか?我々は単一項目モデルを使用している、それは問題の理由ですか?

+0

テーブル構造を追加できますか?ハッシュキーの値は何ですか? –

+0

単一アイテムモデルのテーブル構造については、この[doc](http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/Tools.TitanDB.BestPractices.html)で説明しています。 '単品データモデル'セクションをチェックしてください。 –

答えて

0

データの不均等な分散は、DynamoDB内の同じパーティションキーを中心としたクラスタリングによって引き起こされます。パーティションキーがTitanのアウト頂点IDに対応しているため、ある頂点に多くのプロパティがある場合や、頂点(スーパーノード)から多くのエッジが出てきた場合は、頂点分割を有効にしてグラフをロードしようとする必要があります頂点ラベル。 TitanManagementで頂点ラベルを作成するときは、TitanManagement操作をコミットする前に.partition()を呼び出すだけです。 DynamoDBテーブルに125個のパーティションがある場合は、約256個の最大パーティションが必要になり、データが物理パーティションに均等に分散されることが保証されます。

関連する問題