2017-10-04 9 views
0

enter image description hereHadoopのハイブクエリ

は映画のIDであり、第二は、第三は、人によって与えられた評価され、映画のタイトルです。 さまざまな映画があります。それらのすべてがトイストーリーではありません(例:)。その限られたもの。

私が持っている質問はこれです:に今6人が映画のための1つ星の評価を与えた場合の合計が6である: が最高の評価例えばので

で映画の名前を付けます別の映画、別の2人が評価を与え、1は5つの星を与え、もう1つは1つの星の評価を与える。それで2番目の映画は最高の映画です。

私はhadoopハイブを使ってこの答えを見つける必要があります。

これまで私がやったことがあります。 関数などが必要かどうかわかりません。

enter image description here

答えて

0

使用この、

select a.movie_name from (
select movie_name, sum(rating) as r, count(*) as cnt 
from tableMovieDetail 
group by movie_name ) a 
order by a.r , cnt desc 
関連する問題