2017-07-19 13 views
0

私は、Pandasを使用してPythonで顧客データのセグメンテーションを実行しようとしています。私は私のデータセットに顧客ID変数を持っています。 Output変数に影響を与える変数とはみなされませんが、私はここで混乱しています。必要に応じてこの変数を実際に扱うにはどうすればよいですか?一意キー - 得意先コード、カテゴリまたは数値変数?

また、customerIDがどこにあると考えることができるビジネスケースがありますか?

+0

あなたが求めていることは完全にはっきりしていません...サンプルデータやコンテキストを提供するためのユースケースを提供できますか? –

+0

データセット内のレコードの一意のキーであるCustomerIDという列があります。私はちょうどデータセットのセグメンテーションのビットをしようとしています。私の最初の質問は、「CustomerIDのデータ型は本当に重要なのですか」でした。分析のためにCustomerIDを検討するビジネス上の疑問があります。 – Sid29

答えて

1

私は変数としてcustomerIDを使うべきではないと思います。これは各顧客のユニークな価値です。インデックスとして使用して、顧客が予測に属するものを知ることができます。

トレーニング/テストデータからこの列を削除する方がよいでしょう。

+0

さて、ありがとう:) – Sid29

関連する問題