2016-09-30 11 views

答えて

2

、使用:

features.categorical(「passenger_count」)

またにおいてもまれに発生するワンホットエンコード値を避けるために、周波数閾値に渡すことができデータ。

4

あなたが望む表現の種類を選択するには、k(または1つの暑い)か疎かを選択する必要があります。

features.categorical('passenger_count').one_of_k() 

サイドノートでは、あなたはまた、数値の列に興味がある、とバケット経由または離散(カウント機能の種類にしばしば有用)ログを適用する機能があります。

関連する問題