私は、Pandasを使用してPythonで顧客データのセグメンテーションを実行しようとしています。私は私のデータセットに顧客ID変数を持っています。 Output変数に影響を与える変数とはみなされませんが、私はここで混乱しています。必要に応じてこの変数を実際に扱うにはどうすればよいですか?一意キー - 得意先コード、カテゴリまたは数値変数?
また、customerIDがどこにあると考えることができるビジネスケースがありますか?
私は、Pandasを使用してPythonで顧客データのセグメンテーションを実行しようとしています。私は私のデータセットに顧客ID変数を持っています。 Output変数に影響を与える変数とはみなされませんが、私はここで混乱しています。必要に応じてこの変数を実際に扱うにはどうすればよいですか?一意キー - 得意先コード、カテゴリまたは数値変数?
また、customerIDがどこにあると考えることができるビジネスケースがありますか?
私は変数としてcustomerIDを使うべきではないと思います。これは各顧客のユニークな価値です。インデックスとして使用して、顧客が予測に属するものを知ることができます。
トレーニング/テストデータからこの列を削除する方がよいでしょう。
さて、ありがとう:) – Sid29
あなたが求めていることは完全にはっきりしていません...サンプルデータやコンテキストを提供するためのユースケースを提供できますか? –
データセット内のレコードの一意のキーであるCustomerIDという列があります。私はちょうどデータセットのセグメンテーションのビットをしようとしています。私の最初の質問は、「CustomerIDのデータ型は本当に重要なのですか」でした。分析のためにCustomerIDを検討するビジネス上の疑問があります。 – Sid29