2017-03-08 5 views
0

キャンパス犯罪率を独立変数として使用しているプロジェクトに取り組んでいます。データは非常に積極的に歪んでいます。私はOLSを実行するために正規分布を達成するためにデータを変換する必要があります。ただし、ログ変換を行うと、犯罪率が0(犯罪がないことを表す)のすべてのインスタンスが失われることがわかります。他に可能な解決策は何ですか?犯罪率を変える

答えて

1

log(1 + rate)のように計算することでケースの損失を避けることができますが、非負の境界はとにかく問題を引き起こす可能性があります。一般的な線形モデル(Analyze> Generalized Linear Models)をガンマ・ログ・リンク応答スケール付きで使用することを検討することができます。これは右スキューの問題にも対処できます。

ただし、従属変数ではなくOLS回帰の正規性仮定を運ぶのはエラーです。

+0

ありがとうございました。明らかに、モデル全体が残差に基づくShapiro-Wilk検定で証明された正規性の仮定を満たしていれば、生のデータを正規化することに心配する必要はありません。 – user7441576

+0

予想される犯罪数が、例えば1または0である場合、残差は一方の側で厳しく制限されているため、線形モデルはそこで間違っています。だから私はガンマにログリンクを提案した。 – JKP

関連する問題