2
私はreduce conceptをマップするのが初めてで、次の問題がそれを使って解決できるかどうか疑問に思う。Map時系列解析のためのReduce
は、私たちは、このような形式でデータのログを持っている:
私たちのような異なる時間メトリック、計算することができるようにしたいTransID Date Operation DocumentID User
1 01/01/2010 Open aaa Anne
2 01/11/2010 Close aaa Anne
3 01/12/2010 Open bbb Mary
4 01/12/2010 Close bbb Mary
:
- どのくらいの時間がオープンとの間を通過しますオペレーションをグローバルに終了させる?または
- 各ユーザーごとにオープン平均とクローズ平均の間にどのくらいの時間がかかりますか?
map-reduceでこれを達成する簡単な方法はありますか?私たちはMongoDBやHadoopを検討しています。
データ量は膨大なものになります。ありがとう!
これは確かに可能です。 –