私は、ソーシャルネットワークにユーザの活動を保存するプロジェクトでHBaseを使用することに決めました。 HBaseはデータを表現する簡単な方法(列指向)を持っているにもかかわらず、私はデータをどのように表現するかを決めるのにいくつかの困難に直面しています。活動フィード/ニュースフィード/タイムラインのhbaseデータモデリング
あなたが何百万人ものユーザーを抱えていることを想像してみてください。たとえば、スレッド内でコメントしたり、投票などのように何かを公開すると、各ユーザーはアクティビティを生成しています。 HBaseのテーブル:
キーがユーザの参照+スタンプ活動の作成の値すべてのアクティビティのメタデータであってもよい(ほとんどの時間、固定サイズ)
キーは、ユーザの参照であり、次いで各アクティビティは列ファミリ内に新しい列として格納されます。
第2のアプローチを使用する他のタイプのシステム(ブログなど)の例を見ました。最初のアプローチ(固定列を使用し、スキーマを変更したときのみ変化する)がより一般的に見られます。
これらの2つのアプローチでデータにアクセスする方法にどのような影響がありますか?
ですが、私はhttp://www.slideshare.net/ghelmling/hbase-活動をモデル化する方法についていくつかの材料を含むミートの場合を、見つけましたat-meetup – Cipriani
Oreillyがデータモデリング戦略についてコメントしたHBaseの本の章も見つかりました。http://ofps.oreilly.com/titles/9781449396107/advanced.html – Cipriani