2017-05-18 5 views
-2

の価格帯を予測:私はたとえばなどの種類、場所、ベッドの数、など、家のいくつかの機能を持つデータセットを持っている家

  • タイプ:アパート、セミデタッチハウス、シングルデタッチハウス
  • 場所:(緯度、経度)(40.7128°N、74.0059°W)ベッドルームの
  • 番号のようなペア:1、2、3、4 ...

ターゲット変数Iが欲しいです予測するのは住宅価格です。しかし、元のデータセットに与えられた住宅価格は、例えば、価格の代わりに、数値の間隔である:

  • ハウス価格:[0,100000)、[100000,150000)、[150000,200000)、 [200000,250000]など

私は住宅価格の範囲を予測したい場合はどのモデルを使用する必要がありますか?単純な回帰モデルは、連続した数値ではなく間隔を予測するため、機能しないようです。

ありがとうございます。

答えて

1

私は価格帯の中央値を使用し、線形回帰を実行します。あなたの場合、ラベルは{50000、125000、175000、225000、...}となります。あなたが予測された価格を取得した後は、それが入る範囲を選ぶだけです。

また、価格帯が固定されている場合は、1対全ロジスティック回帰を使用できますが、これは最善の方法ではないと確信しています。

関連する問題