こんにちは、私はスパークSQLの新しいです。私はこのようなデータフレームを持っています。sparksqlで上位10個のレコードを選択できません
---+----------+----+----+----+------------------------+
|tag id|timestamp|listner| orgid |org2id|RSSI
+---+----------+----+----+----+------------------------+
| 4|1496745912| 362| 4| 3| 0.60|
| 4|1496745924|1901| 4| 3| 0.60|
| 4|1496746030|1901| 4| 3| 0.60|
| 4|1496746110| 718| 4| 3| 0.30|
| 2|1496746128| 718| 4| 3| 0.60|
| 2|1496746188|1901| 4| 3| 0.10|
spark sqlの各リスナー上位10個のタイムスタンプの値を選択します。
私は次のクエリを試しました。これはエラーを投げます。
val avg = sqlContext.sql("select top 10 * from avg_table") // throws error.
val avg = sqlContext.sql("select rssi,timestamp,tagid from avg_table order by desc limit 10") // it prints only 10 records.
各リストメンバーに対して選択したいのは、上位10個のタイムスタンプ値を取る必要があります。どんな助けもありがとう。
私は記録する必要があるすべてのリスナーの価値はありません...だからそれはうまく動作しません –
a。*は何ですか?上記のコードで.. –
@ TeePriya。 。 。サブクエリ内のすべての列をリストする必要がないようにするだけの方法です。 –