1
3つの列から行の中で最大の値を選択する必要があるシナリオがあります.Greatestという関数がありますが、それは私のバージョンでは機能しませんハイブの0.13。ハイブで行の最大値を持つ列を取得する
より良い方法を提案してください。
例表:
+---------+------+------+------+
| Col1 | Col2 | Col3 | Col4 |
+---------+------+------+------+
| Group A | 1 | 2 | 3 |
+---------+------+------+------+
| Group B | 4 | 5 | 1 |
+---------+------+------+------+
| Group C | 4 | 2 | 1 |
+---------+------+------+------+
期待される結果:
+---------+------------+------------+
| Col1 | output_max | max_column |
+---------+------------+------------+
| Group A | 3 | Col4 |
+---------+------------+------------+
| Group B | 5 | col3 |
+---------+------------+------------+
| Group C | 4 | col2 |
+---------+------------+------------+
ドゥドゥ、あなたの助けのおかげとも問題のテーブルをフォーマットするため。上記の例で、col2,3,4が整数ではなく日付である場合、タプルがシナリオで動作するかどうかを簡単に解明していますか? – user3273269
はいそれはうまくいくはずです(ハイブの日付はINO形式のYYYY-MM-DDです) –