2016-12-05 2 views
0

私は都市の郊外の混在環境における他の地物からの距離に基づいて地理空間的特徴の予測モデルを構築しようとしています。例えば、オフィスブロックが最寄りの道路、住宅地、ショッピングエリア。私はフィーチャの場所のセットを持っていますが、ブロックは非常にまばらな領域や非常に密な領域では領域全体に均一に散らばっていません。意思決定ツリーを使ってある場所の学校の有無を予測するには、肯定的なケースと否定的なケースの両方のトレーニングセットが必要です。そのようなケースのサンプルを作成するにはどうすればよいですか?あなたは、次の形式のデータを必要とするでしょう地理空間機械学習の母集団サンプリング

答えて

1

:...

nearestRoadhousingEstateshoppingDistrictを、schoolPresent

nearestRoadrealNumberhousingEstateshoppingDistrictはバイナリ変数(私は推測しているだろうだろう)。 Googleマップをチェックしましたか?特定の(緯度、経度)座標を照会できるAPIを提供していますか?もしそうなら、次のようにデータセットを生成することができます:

座標が(x,y)の学校があるとします。次に、各フィーチャの正確な値を取得するには、半径が5マイルのgridsearchを実行します。例えば、(x+1, y+2)という座標のショッピング街があるので、この特定のインスタンスの機能は1になります。

これは面倒かもしれませんが、そのようなAPIが存在する場合は間違いなく可能です。