データマイニングに序数でスケーリングんしても意味がない、「品質」という名前の列があり、その値は次のとおりです。それはデータマイニング回帰問題に
['Excellent','Good','Average','Fair','Poor']
ので、私は「良い」と思います「平均」よりも優れている、と私はマッピングに序数にそれらを変更します。
'Excellent' : 5
'Good' : 4
'Average' : 3
'Fair' : 2
'Poor' : 1
ので、私の質問は次のとおりです。
私は数に値を変更した後、私はこのことについて平均と分散でスケーリングを行うことができますまたはディナール番号、たとえば、StandardScaler with pandas
この質問はプログラミングに関連していないので、http://stats.stackexchange.com – Sentry