Pigでは、特定のIDを指定してavail_untilを次のレコードのavail_sinceに設定する必要があり、デフォルトでは9999-12-31に設定されます。 IDを与えられた。私はIDでデータを注文してからAvail_Sinceから始めていますが、それ以降は固執しています。私は、オーバー/ステッチ/リード/ラグ機能が必要かもしれないとは思いますが、わかりません。どんな助けでも大歓迎です!Apache PIG - 次のレコードの日付として現在の行の日付を設定します
あなたは、2倍のデータをロードするユニークなIDを生成するためにそれをランク付けし、第二のデータセットからのトップレコードをフィルター、再びそれをランク付けし、ユニークなIDのデータセットへの参加、から最後のレコードを取得する必要がありますInput Data:
ID AVAIL_SINCE AVAIL_UNTIL
1 19-Jan-00 31-Dec-99
1 11-Jun-00 31-Dec-99
1 4-Aug-00 31-Dec-99
1 19-May-01 31-Dec-99
2 5-May-02 31-Dec-99
2 8-Apr-03 31-Dec-99
3 10-Jun-00 31-Dec-99
3 31-Oct-00 31-Dec-99
3 29-Dec-00 31-Dec-99
Required Result:
ID AVAIL_SINCE AVAIL_UNTIL
1 19-Jan-00 11-Jun-00
1 11-Jun-00 4-Aug-00
1 4-Aug-00 19-May-01
1 19-May-01 31-Dec-99
2 5-May-02 8-Apr-03
2 8-Apr-03 31-Dec-99
3 10-Jun-00 31-Oct-00
3 31-Oct-00 29-Dec-00
3 29-Dec-00 31-Dec-99