DB <- data.frame(orderID = c(1,2,3,4,4,5,6,6,7,8),
orderDate = c("1.1.12","1.1.12","1.1.12","13.1.12","13.1.12","12.1.12","10.1.12","10.1.12","21.1.12","24.1.12"),
itemID = c(2,3,2,5,12,4,2,3,1,5),
customerID = c(1, 2, 3, 1, 1, 3, 2, 2, 1, 1),
itemPrice = c(9.99, 14.99, 9.99, 19.99, 29.99, 4.99, 9.99, 14.99, 49.99, 19.99))
期待される成果:理解するための
DB <- data.frame(orderID = c(1,2,3,4,4,5,6,6,7,8),
orderDate = c("1.1.12","2.1.12","3.1.12","13.1.12","13.1.12","12.1.12","10.1.12","10.1.12","21.1.12","24.1.12"),
itemID = c(2,3,2,5,12,4,2,3,1,5),
customerID = c(1, 2, 3, 1, 1, 3, 2, 2, 1, 1),
itemPrice = c(9.99, 14.99, 9.99, 19.99, 29.99, 4.99, 9.99, 14.99, 49.99, 19.99),
DateOfFirstOrderofCustomer = c("1.1.12", "2.1.12", "3.1.12", "1.1.12", "1.1.12", "3.1.12", "2.1.12", "2.1.12", "1.1.12", "1.1.12"))
:
orderI
Dが連続しています。同じ日から同じcustomerID
から注文された商品は、同じorderID
となります。同じ顧客が別の日に商品を注文すると、それは新しいorderID
です。私は、顧客の最初の注文(例えば、顧客1(customerID
1)の日付を含むすべての行/エントリの追加の列を追加したい
ので、この日付は、この顧客からのすべての注文に入力され1.1.12
の彼の最初の注文をしました)。どうすればこのことができますか?
元のデータは約500k行です:したがって、わずかな性能しか必要としないソリューションを提供します。
あなたの 'orderDate'データと期待される結果は一致しません。うまくいけば私の答えはダミーデータを含むことでこれを解決します。 – MikeRSpencer
そうです - 私の間違い:/ – AbsoluteBeginner