2012-04-11 14 views
0

私の受信トレイをダウンロードしました。私はPigとHadoopでメールを処理しています。私はPigとWonderdogを使ってElasticSearchでこれらの電子メールのインデックスを作成しました。Hadoopを使用するタイミングは、ElasticSearchをグループ/ファセットに使用するタイミングですか?

ここでは、これらのアドレスから送信されたメッセージを表示するために、受信ボックスにメールアドレスごとにウェブページを作成しています。

私は2つの方法でこれを行うことができます:

1)グループ豚、MongoDBの(またはElasticSearchへのストア)での電子メールアドレスで。

2)ElasticSearchを照会すると、facetsを使用してメールリストからこのリストが返されます。

これはどちらが頼りになるのでしょうか。

答えて

1

オプション1 - ブタでのメールアドレスによるグループ、MongoDBの(またはElasticSearch)へのストア:

あなたは結果を事前に計算し、MongoDBのかElasticSearchに保管されています。データが大きくて頻繁に更新されない場合は、これが良いことです。

オプション2 - ElasticSearchをクエリすると、このリストがファセットを使用する電子メールインデックスから返されます。

小規模なデータセットであってもデータが頻繁に更新される場合は、データを照会する(正しいフィールドに索引付けされる)ようにすると、結果がすぐに得られ、前処理に頼る必要はありません。

関連する問題