Spark Hive - ウィンドウ関数を持つUDFArgumentTypeException？

私は、次のdf持っている：私は何を取得したいことは、最後の最新の日付のよう（最後の2つのエントリであるSpark Hive - ウィンドウ関数を持つUDFArgumentTypeException？

WindowSpec window = Window.partitionBy(df.col("id")).orderBy(df.col("eventdate").desc()); 
df.select(df.col("*"),rank().over(window).alias("rank")) //error for this line 
     .filter("rank <= 2") 
     .show();

：として私は窓関数を実行しようとしている

+------------+----------------------+-------------------+         
|increment_id|base_subtotal_incl_tax|   eventdate|         
+------------+----------------------+-------------------+         
|  1086|   14470.0000|2016-06-14 09:54:12|         
|  1086|   14470.0000|2016-06-14 09:54:12|         
|  1086|   14470.0000|2015-07-14 09:54:12|         
|  1086|   14470.0000|2015-07-14 09:54:12|         
|  1086|   14470.0000|2015-07-14 09:54:12|         
|  1086|   14470.0000|2015-07-14 09:54:12|         
|  1086|    1570.0000|2015-07-14 09:54:12|         
|  5555|   14470.0000|2014-07-14 09:54:12|         
|  5555|   14470.0000|2014-07-14 09:54:12|         
|  5555|   14470.0000|2014-07-14 09:54:12|         
|  5555|   14470.0000|2014-07-14 09:54:12|         
+------------+----------------------+-------------------+

をそれはユーザごとに、最初の2行）を降順で注文していますから、しかし：

+------------+----------------------+-------------------+         
|increment_id|base_subtotal_incl_tax|   eventdate|         
+------------+----------------------+-------------------+         
|  1086|   14470.0000|2016-06-14 09:54:12|         
|  1086|   14470.0000|2016-06-14 09:54:12| 
|  5555|   14470.0000|2014-07-14 09:54:12|         
|  5555|   14470.0000|2014-07-14 09:54:12|          
+------------+----------------------+-------------------+

が、私はこれを取得：

+------------+----------------------+-------------------+----+ 
|increment_id|base_subtotal_incl_tax|   eventdate|rank|        
+------------+----------------------+-------------------+----+        
|  5555|   14470.0000|2014-07-14 09:54:12| 1|        
|  5555|   14470.0000|2014-07-14 09:54:12| 1|        
|  5555|   14470.0000|2014-07-14 09:54:12| 1|        
|  5555|   14470.0000|2014-07-14 09:54:12| 1|        
|  1086|   14470.0000|2016-06-14 09:54:12| 1|        
|  1086|   14470.0000|2016-06-14 09:54:12| 1|        
+------------+----------------------+-------------------+----+

私には何が欠けていますか？

[OLD]は - もともと、私はエラーがあったが、これは解決されました：

WindowSpec window = Window.partitionBy(df.col("id")); 
df.select(df.col("*"),rank().over(window).alias("rank")) //error for this line 
     .filter("rank <= 2") 
     .show();

これは、しかし、コメントして上にマークされた行のエラーException in thread "main" org.apache.hadoop.hive.ql.exec.UDFArgumentTypeException: One or more arguments are expected.を返します。私は何が欠けていますか？このエラーは何を意味しますか？ありがとうございました！それ故に、エラー単に無意味であるためなし

WindowSpec window = Window.partitionBy(df.col("id")).orderBy(df.col("payment"));

：

出典

2016-07-20 lte__

rank窓関数は、例えばorderByと窓、句を必要とします。

出典

2016-07-20 08:17:18 zero323

ありがとうございました！私はあなたの答えを受け入れるだろうが、私の質問を更新しました。これで私を助けることができれば、とても感謝しています。 –

Spark Hive - ウィンドウ関数を持つUDFArgumentTypeException？

答えて

関連する問題