私の質問は、私が現在の仕事の一部として取り組まなければならない分野の一つに直面している問題です。取引レベルのデータからの口座レベルビュー
ドメインはクレジットカード取引です。したがって、トランザクションレベルではユニークです。しかし、1人が複数のトランザクションを実行する可能性があります。今や明らかに各トランザクションは同一ではありません。
私は簡単に管理できるこの基本的な特性データセットを持っています。このデータセットから、さまざまな変数の組み合わせに対して自分のコードを実行しなくても簡単にアクセスできる、セグメント間のカスタマーレベルのパフォーマンスを評価したいと思います。基本的に、私が目指しているのは、顧客レベルのビューに到達しているということです。アカウントの情報が失われることはなく、セグメント間で顧客レベルのパフォーマンスを引き続き見ることができます。
同様の分析を行ったことがありますか?または、これをどうやってやるべきか、明るい考えがありますか?私はこの説明がどれほど明るいかわかりませんが、それ以上の説明が必要な場合はお知らせください。ご協力いただきありがとうございます!
より具体的にする必要があります。あなたは何を持っていますか、何をしたいですか、何を試しましたか...... – DCR
いいえ、私はトランザクションIDを持っています。ユニークです。各トランザクションIDはアカウントIDになります。これが繰り返されます。各トランザクションは、一連のカテゴリ変数によって定義されます。各トランザクションに変数A、B、C、Dがあるとします。そして、私はこれらの変数の各組み合わせのパフォーマンス分析を行う必要があります。アカウントIDは、各組み合わせで一意になります。 A、Bレベルでパフォーマンスを要約しなければならないという問題があるとします。 A、B、Cレベル。 私は単一のcsvで両方のビューを見たいと思います。現在私が思うのは、procサマリーと_TYPE_変数のトグルです。 –
あなたが手伝ってくれるように助けが必要な場合。あなたのデータベースの小さなサンプルを投稿して、好きなものを投稿してください。 – DCR