DataSax AcademyのCassandraビデオの1つを見ていました。彼らがよく話す概念の1つは、クエリ駆動型のモデリングです。これはKillrVideoの例のようにクエリが先行していることを知っているときに意味があります。クエリ駆動型モデリングとビッグデータ
しかし、大きなデータのケースでは、アナリストが5ヶ月または1年後のデータに対してどのような種類のクエリを実行するかわからないと思っているだけではないと思います。
この場合、データを保存するためのベストプラクティスは何ですか?私の推測では、そのようなデータの高度なクエリでは、データをSparkにロードすることになります。しかし、検索時に操作上のトラブルやトラブルを避けるために、保管時には何を考慮する必要がありますか?どのような検索方法が問題になるのでしょうか?