は、私がこれに似たデータセットを持っている:キーでグループ化されたタイムスタンプで最新のレコードを返す方法は?
{"user":333,"product":943, "rating":2.025743791177902, "timestamp":1481675659}
{"user":333,"product":3074,"rating":2.1070657532324493,"timestamp":1481675178}
{"user":333,"product":3074,"rating":2.108323259636257, "timestamp":1481673546}
{"user":333,"product":943, "rating":2.0211849667268353,"timestamp":1481675178}
{"user":333,"product":943, "rating":2.041045323231024, "timestamp":1481673546}
{"user":333,"product":119, "rating":2.1832303461543163,"timestamp":1481675659}
{"user":333,"product":119, "rating":2.1937538029700203,"timestamp":1481673546}
{"user":111,"product":123, ...
私は、ユーザー(例えば333)のためのすべてのレコードを照会するが、唯一の各製品の最新のタイムスタンプを返すようにしたいと思います。例えば。上記のデータに基づいて、クエリが返します:
SELECT * FROM recommendations L
LEFT JOIN recommendations R ON
L.user = R.user AND
L.product = R.product AND
L.timestamp < r.timestamp
WHERE isnull(r.user) and isnull(r.product)
は/インデックスを減らすマップで、このことが可能です:
{"user":333,"product":119, "rating":2.1832303461543163,"timestamp":1481675659}
{"user":333,"product":3074,"rating":2.1070657532324493,"timestamp":1481675178}
{"user":333,"product":943, "rating":2.025743791177902, "timestamp":1481675659}
同等のSQLクエリは、このような「何か」を見てでしょうか?もしそうなら、どうですか?そうでない場合は、lucene indexなどの代替アプローチがありますか?
理想的には、評価値で並べ替えることもできます。