Datastax Academyデータモデリングコースの式を使用して、任意の数の列とタイプのテーブル内の各行のパーティションサイズを計算しようとしています。一般的なCassandraデータタイプのバイトサイズとは何ですか? - パーティションディスク使用量を計算するときに使用されますか?
これを行うには、いくつかの一般的なCassandraデータタイプの「バイトサイズ」を知る必要があります。私はこれをGoogleにしようとしましたが、私は多くの提案を得て、私は困惑しています。私はのバイトサイズを知りたいのですが
データ型は、次のとおりです。
- 単一カサンドラのTEXT文字が(私は2から回答ググ - 4バイト)
- AカサンドラDECIMAL
- AカサンドラをINTは、
- A CassandraのBIGINT(私はそれが4バイトであると仮定)(..私は、それが1バイトであると仮定するか、単一ビットである)
- A CassandraのBOOELAN(私はそれが8バイトであると仮定する)
カサンドラのデータタイプのサイズについては、他の考慮事項も当然理解できます。
私は、「最悪のシナリオディスク使用量」を推測しようとしていることを理解するのが紛らわしいので、追加情報を追加すると、カサンドラの背後にある圧縮やその他の最適化がデータに占有されます。
私はDatastax Academy Course DS220(最後のリンクを参照)に従い、数式を実装しており、その式の変数としてここでの回答を使用します。
https://academy.datastax.com/courses/ds220-data-modeling/physical-partition-size
を役に立てば幸い、カサンドラは、ディスク上のデータを圧縮します。したがって、あなたが持っているデータによっては、実際のストレージサイズを評価するのに非常に役立つものではありません。私はあなた自身のサイズをベンチするべきだと思います。 –
面白い答えはDatastax Academyコースでは語られていません! Cassandra(私はC * 3. +を使用しています)で使用されるデータ圧縮率は何ですか、そして私が求めているタイプのサイズは?ありがとう! – nicgul
私が求めているのは、ユーザーに、広い行の「オーバーヘッド」を含む、ストレージに入れるデータのサイズについてのヒントを与えるユースケースがあるからです。 – nicgul