Titanに追加される314mのレコードがあります。バックエンドとしてDynamoDBテーブルを使用してAmazon Titanを操作すると、約10%のデータが125のうち1つのパーティションに配置されていることに気づきました。Amazon Titan:データがDynamoDBパーティションに不均等に分散されています
この不均一な分布は、この不均等な分配の理由は何でしょうか?我々は単一項目モデルを使用している、それは問題の理由ですか?
Titanに追加される314mのレコードがあります。バックエンドとしてDynamoDBテーブルを使用してAmazon Titanを操作すると、約10%のデータが125のうち1つのパーティションに配置されていることに気づきました。Amazon Titan:データがDynamoDBパーティションに不均等に分散されています
この不均一な分布は、この不均等な分配の理由は何でしょうか?我々は単一項目モデルを使用している、それは問題の理由ですか?
データの不均等な分散は、DynamoDB内の同じパーティションキーを中心としたクラスタリングによって引き起こされます。パーティションキーがTitanのアウト頂点IDに対応しているため、ある頂点に多くのプロパティがある場合や、頂点(スーパーノード)から多くのエッジが出てきた場合は、頂点分割を有効にしてグラフをロードしようとする必要があります頂点ラベル。 TitanManagementで頂点ラベルを作成するときは、TitanManagement操作をコミットする前に.partition()を呼び出すだけです。 DynamoDBテーブルに125個のパーティションがある場合は、約256個の最大パーティションが必要になり、データが物理パーティションに均等に分散されることが保証されます。
テーブル構造を追加できますか?ハッシュキーの値は何ですか? –
単一アイテムモデルのテーブル構造については、この[doc](http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/Tools.TitanDB.BestPractices.html)で説明しています。 '単品データモデル'セクションをチェックしてください。 –