0

私はバイナリデータ(0,1)と数値の異なるデータを持つデータセットを持っています。データを分類するために機械学習技術を適用したい場合(自動エンコーダーまたは階層クラスタリングの可能性があります)、データを標準化または正規化する必要がありますか?オートエンコーダ、ワード階層クラスタリングなどの前にデータを標準化/正規化(バイナリ+数値)しますか?

ありがとうございました!

答えて

0

によって異なります。

ニューラルネットワークでは、数値的な理由から連続変数を標準化することができます。しかし、あなたのプラットフォームによって異なります。 Googles TPUsを考慮してください:1バイトの精度で動作するので、関連する入力ドメインでこの限定された範囲を最適に使用します。

クラスタリングのような距離ベースの方法では、データの前処理は非常に重要ですが、困難です。常に標準化が正しいことは間違いです。しかし、いくつかの正規化を適用することはかなり一般的です。しかし、最高の正規化を見つけるためにはドメイン専門家が必要です。

関連する問題