2011-09-13 4 views
11

実行中です。ハイブ071 複数の行を持つテーブルがあり、同じ列の値が です。ハイブの特定の列で明確になります

x | y | 
--------- 
1 | 2 | 
1 | 3 | 
1 | 4 | 
2 | 2 | 
3 | 2 | 
3 | 1 | 

は私が独自のx列を持っている、と 例えば同じx valを持つ行を削除したいです

x | y | 
--------- 
1 | 2 | 
2 | 2 | 
3 | 2 | 

または

x | y | 
--------- 
1 | 4 | 
2 | 2 | 
3 | 1 | 

のみハイブ全体RSの両方の良い として明確な作品です、私はそれ

助けてください のTx

を行うための方法を見つけることができませんでした
+3

[ハイブの特定の列で明確な]の複製が可能です(http://stackoverflow.com/questions/7401818/distinct-on-specific-column-in-hive) – Mat

+0

この問題の解決方法はありますか? – frugalcoder

答えて

1

distinctキーワードを使用できます。

SELECT DISTINCT x FROM table 
+3

私はXとYの両方を受け取る必要があるが、Xを区別する必要があるので、これは問題である。いくつかのDBでは、これは「x、yをテーブルから区別する」を使用して行うことができますが、ハイブの線量サポートは「distinct on」 – Tomer

+0

私のために働いてくれてありがとう! – Srekk

-2

結果取得するクエリ以下試してください。

(testinggからランクとしてX、Y、ランク(選択))YによってX順序によってパーティション(上)からA.x、A.yを選択= 1ランクA。

関連する問題