bigqueryには次のトランザクションが格納されています。bigqueryまたはsqlで購入した顧客と複数の顧客との取引日ギャップの平均を求める
CUSID PID TID YYYYMMDD
A01 P01 001 2017-01-01
A02 P01 002 2017-02-25
A02 P02 002 2017-02-25
A03 P02 003 2017-03-01
A03 P02 004 2017-03-05
A03 P02 004 2017-03-05
A04 P01 005 2017-03-10
A04 P03 005 2017-03-10
A04 P03 006 2017-03-11
A04 P03 007 2017-03-15
私は次のように与えられた製品のための2つのことを見つけるしたいと思います:
1)X:総顧客数と
2で割っ購入した顧客の数)Y:
したがって、すべての顧客の購買の平均日のギャップは、予想される出力は、次の表
CUSID PID TID YYYYMMDD X Y
A01 P01 001 2017-01-01 3/4 = 0.75 AVG(0,0,0) = N/A (P01 does not have re-purchasing by A01, A02, and A04)
A02 P01 002 2017-02-25 3/4 = 0.50 AVG(0,0,0) = N/A (P01 is not re-purchased by A01, A02, and A04)
A02 P02 002 2017-02-25 2/4 = 0.50 AVG(0,4) = 4 (P02 is not re-purchased by A02 but it is re-purchased by A03 for 4 days. Note: duplicated product in the same TID is excluded, e.g. TID = 004)
A03 P02 003 2017-03-01 2/4 = 0.50 AVG(0,4) = 4 (P02 is not re-purchased by A02 but it is re-purchased by A03 for 4 days. Note: duplicated product in the same TID is excluded, e.g. TID = 004)
A03 P02 004 2017-03-05 2/4 = 0.50 AVG(0,4) = 4 (P02 is not re-purchased by A02 but it is re-purchased by A03 for 4 days. Note: duplicated product in the same TID is excluded, e.g. TID = 004)
A03 P02 004 2017-03-05 2/4 = 0.50 AVG(0,4) = 4 (P02 is not re-purchased by A02 but it is re-purchased by A03 for 4 days. Note: duplicated product in the same TID is excluded, e.g. TID = 004)
A04 P01 005 2017-03-10 3/4 = 0.75 AVG(0,0,0) = N/A (P01 is not re-purchased by A01, A02, and A04)
A04 P03 005 2017-03-10 1/4 = 0.25 AVG(1,4) = 2.5 (P03 is repurchased by A04 for 1 and 4 day gaps)
A04 P03 006 2017-03-11 1/4 = 0.25 AVG(1,4) = 2.5 (P03 is repurchased by A04 for 1 and 4 day gaps)
A04 P03 007 2017-03-15 1/4 = 0.25 AVG(1,4) = 2.5 (P03 is repurchased by A04 for 1 and 4 day gaps)
です
あなたの提案はありますか?以下は
テーブルに購入した顧客と購入していない顧客の違いは何ですか? –
私はその製品がどれくらい顧客に人気があるかを観察したいと思います。したがって、購入した顧客は、その製品を採用するすべての顧客であり、購入していない顧客は、その製品を採用していない顧客です。製品P01は3人の顧客A01、A02、およびA04によって購入されたが、A03は依然としてそれを購入していない。 –
少なくともすべての顧客のテーブルが必要です。 –