私は最近、Cassandraが時間ベースのイベントをイベントタイプごとにカスタムttlsで保存することに合っていました(もう1つの解決策は、hadoopに保存して手動で簿記することです) IMHOは非常に複雑なアイデア)、またはhbaseに切り替える)。 問題は、Datastax Enterprise Editionなしで、cassandra MapReduceサポートがすぐに使えることです。Cassandras Map Reduce Support
CassandraFSに多額の投資をしたようですが、通常のPig CassandraLoaderが積極的に管理され、実際にはスケールされているかどうかは疑問です。(スライスの行を繰り返すだけです。 これは何百万行にも及んでいますか?
私はすでにプロジェクトでcassandraを使用しているので、実際に新しい技術を導入したくないからです。 – Tobias
良い点。常にすべてのデータを処理することができれば - これはうまくいくはずですが、データが大きくなる場合は、マップの負荷を軽減するために、ワークロードの保存量を増やすことを再検討することをおすすめします。 – octo
これはどういう意味ですか?多くの(ほとんどの?)カザンドラクラスターは、何十億もの行をサポートしています。あなたは修理に言及しますが、それはもちろん同様に配布されます。 – jbellis