2017-08-03 15 views
-1

重複する値で区切られた列(文字列)スペースがあります。重複を削除したい: ハイブテーブルから文字列の重複を削除する方法

column_name 
----------------- 
gun gun man gun man 
shuttle enemy enemy run 
hit chase 

私は次のようになりたい:私はハイブdatabase.Pleaseヘルプを使用しています

column_name 
---------------- 
gun man 
shuttle enemy run 
hit chase 

+0

の可能性のある重複した[ハイブの文字列で重複を削除する方法?](https://stackoverflow.com/questions/42874823/how-to-remove-duplicates-in-hive-string) –

答えて

-1

カスタムUDFを使用しない場合、これはクエリのみで行う方法の1つです。

select id, concat_ws(' ',collect_set(splited)) as column_name 
from 
(
    select id, splited 
    from tbl_name 
    LATERAL VIEW explode(split(column_name,' ')) t as splited 
    group by id, splited 
) x 
group by id 
+0

は非常にありがとう多く。それは働いている – Camel

関連する問題