私はY '値を予測する機械学習アルゴリズムを構築します。このために、データのスケーリングにYのLog値を使用しました。 予測されたY 'と実際のYの値を得たので、Yのログ値Y & Y'を指数値に変換する必要があります。ログ値から指数値まで、機械学習アルゴリズムの予測のための巨大な歪み
しかし、exp7(= ln1098)の値からは非常に大きな歪みがありました...それは多くのMSE(エラー)を作ります。
どのようにこの巨大な歪みを避けることができますか?(通常1000を超える値を取得する必要があります)
ありがとう!!
従属変数のログを取ることは、乗法的なノイズ(つまり、ノイズが従属変数のサイズに比例する)がある場合に意味があります。そうでない場合は、それをしないでください。平均0と分散1(すなわち、平均を減算し、標準偏差で除算)に正規化することは、数値的問題を避けるのに役立ちます。おそらくそれを試すことができます。 stats.stackexchange.comまたはdatascience.stackexchangecomでもっと役に立つ回答が得られるかもしれません。 –