2017-05-03 26 views

答えて

2

スパークにはmonotonically_increasing_idというメソッドがあります。これはrow_numberよりも簡単で目的に合ったものです。あなたはこのようにそれを使用することができます:

SELECT MONOTONICALLY_INCREASING_ID() AS table_id, t1.* 
FROM table_1 t1 
ORDER BY <columns> 

そしてまた、あなたの代理キーが再現させるためにORDER BYを追加することを忘れないでください。

1

表示されている構文は、SQL Server用です。 Spark SQLでは、row_number()を使用して結果セットにカラムを追加できます。次のようなものがあります。

SELECT ROW_NUMBER() OVER (ORDER BY col) as table_id, t1.* 
FROM table_1 t1; 
関連する問題