0
私は、年齢証明、教育レベル、リレーションシップマネージャーコードなどの主にカテゴリ変数を持つ保険詐欺データセットに取り組んでいます。異常を検出している間にカテゴリ変数を扱うにはどうすればよいですか?
そのデータセットの異常を検出するために、私は頻度カウントに基づいてカテゴリに数値を変換し、レベルの割合を計算しました。
これは正しい方法ですか?そうでない場合は、異常値を検出している間にカテゴリ変数を扱う方法を提案してください。