0
次のような表を持っています。ハイブの各単語のユニークワード数を取得
select * from tablename;
ID sentence
1 This is a sentence
2 This might be a test
3 America
4 This this
文章を単語に分割し、降順で単語の数を取得するクエリを作成します。私は
カウントは単語列とユニーク(IDS)で発生した回数があるword count Unique(ids)
This 4 3
a 2 2
might 1 1
.
.
.
は、その単語を持つユーザーの数である、のような出力に何かを持っていると思います。
私はこれを行うためにどのようにクエリを書くことができると考えていますか?
誰でもハイブでこれをやってくれますか?
おかげ
結果を集約データベースタグ。 –