2010-12-31 12 views
1

これは新しく、私の要件は次のとおりです。
ムービーの定格(テキスト形式)のテキストの巨大なデータセットを処理して、 NoSQLデータベースを作成してから、特定のムービーをいくつか処理して映画を推薦します。Java + Hadoop + NoSql(使用する組み合わせ)

私はスピードが必要です - 私はHadoopがこれを手助けし、NoSQLデータベースにデータを保存することがさらにスピードアップに役立つと思います。

+0

データセットはどのくらい巨大ですか?テラバイト、ペタバイト?テキストファイル、XML、バイナリ形式のようなあなたのデータセットは何ですか? –

+0

この時点では、データはギガバイト単位であり、すべてがテキスト形式です – daydreamer

答えて

0

どのように巨大ですか? Apache Mahoutにチェックしてください。それは、コラボレーティブなフィルタリングアルゴリズムのための疎なデータの保存と処理という、非常に効率的なデータ構造を持っています。それは、あなたのデータセットが1台のマシンから成長しはじめると、それはハイドープでの分割処理をサポートしています。

0

のNoSQLデータストアが使用するについてあなたが迷っている場合は、this postは役立つかもしれないありがとう他のいくつかのアプローチがよく知られており、どのような組み合わせは、Java

で使用している場合、私は知っていると思います。

関連する問題