から最初と最後の日付を選択します私は薬剤が下ケースクラスであるフォームのグループ化RDD(patientIDを、[薬物])、持ってグループ化されたRDD
val grpMeds = medication.groupBy(_.patientID)
ここで、投薬はRDD [投薬]という形式のRDDです。
各患者について、最も早い日付と最新の日付を検索しようとしています。特定の種類の薬「medicine_A」が投与されました(薬はcase class Medication
の方法です)。私が入手しようとしているのは、RDD [patientID、earliestDate、latestDate]の形式のRDDですが、これを取得する方法を理解することはできません。
ご協力いただければ幸いです。データは以下のようになります(grpMeds.take(0).foreach(println)
から取得)。 groupBy
を使用して
Medication(000961291-01,Tue Jun 21 19:45:00 UTC 2005,Isotonic Saline (0.9%))
Medication(000096430-01,Mon Nov 15 20:45:00 UTC 2010,insulin aspart)
だから何が '分を使用して間違っています'と' '最大'?サンプルデータと期待される結果は役に立ちます。 – sgeddes
日付はjava.utils.Date関数です。私はそれが最小/最大メソッドを持っているとは思わないが、私はdate1before(date2)を使用することができます。 'grpMeds.take(0).foreach(println)'が返すものの例を追加しました。 – mongolol