まず、あいまいな質問をお詫び申し上げます。私に説明させてください。 私は2列、すなわち平方フィートと寝室数を含むパンダデータフレームを持っています。私は線形回帰を使って価格を計算しようとしており、行列を実行してGradient Descentを計算したいと考えています。平方フィートは寝室数の1000倍であり、グラデーションデサントはうまく収束しないので、私は正規化によって属性のこの尺度分散を処理しようとしています。pythonのpandasデータフレームでapplymapを使って正規化のスケールを扱う方法
私がやっている特定の正規化は、それぞれの平均で寝室と四角い柱の個々の列セルを減算し、それぞれの標準偏差で結果を除算することです。質問は、私は列の1000のを持っている場合、これはスケールしませんようにこれを行うための簡単な方法がある
meanb= X[['bedrooms']].mean()
meanFeet=X[['sqrfeet']].mean()
stdb=X[['bedrooms']].std()
stdFeet=X[['sqrfeet']].std()
norb=lambda x: (x-meanb)/stdb
nors=lambda x: (x-meanFeet)/stdFeet
X['bedrooms']=X['bedrooms'].apply(norb)
X['sqrfeet']= X['sqrfeet'].apply(nors)
- :私が書いた コードはこれです。 それぞれの列の平均と標準偏差を計算し、各列のそれぞれのセルで正規化を実行するdataframe.applymap()メソッドがあるのだろうかと思います。各列は異なる範囲の値を持つことができますが、すべて数値であることに注意してください。最初の列に記載されている