証券取引価格に関する大量の財務データを分析するシステムを構築しています。これの大きな課題は、データがテラバイトの10にあると仮定して、どのような記憶方法をデータに使用するかを決定することです。平均値の取得、標準偏差の計算、価格、時間、ボリュームなどの複数の列でフィルタリングされた合計など、データに関する多くのクエリがあります。結合ステートメントは必須条件ではありませんが、持つのが良いでしょう。財務分析用データストレージ
今は、評価のために、infobrightコミュニティ版、monetdb、greenplumコミュニティ版を探しています。これまでのところは素晴らしいようですが、より高度な機能については、複数のサーバー、挿入/更新ステートメントなどを使用して、これらのエディションの一部では必要なものがあります。
このような状況では、どのようなソリューションを使用しますか。費用効果が高いことが大きなプラスです。私がデータウェアハウスのソリューションを支払う必要がある場合は、それを避けて、可能であればオープンソース/コミュニティ版のルートをとる方がよいでしょう。
実際に(parial)合計、平均、stddevsはフィルタリングされていてもデータマイニングではありません。彼らは平凡な**政治**です。 –
データマイニングは、一連のデータから新しい情報を検出することです。統計は、このプロセスを支援するツールです。私は専門用語の強調が助長的であるとは思わないし、それについて論じるなら何も成し遂げられないだろう。私はあなたの投稿に同意しないと言っていますが、あなたは統計を「統計」と誤解しています。これは不必要な専門性の強調です。私の目標は、このデータベースを使って新しい情報を発見することです。さらに、データウェアハウスソリューションは、データマイニングを念頭に置いて構築されています。したがって、ここではデータマイニングの概念を適用することができます。 – user396404
しかし、私はあなたに同意する "データベース"はおそらくこのポストのためのより良いタグです。 – user396404