2016-06-17 18 views
0

2次元座標(緯度、経度)を浮動小数点値にマッピングするプログラムを作成しようとしています。私は、これは私が唯一の1次元を使用している見つけた回帰のすべての例を除いて、回帰問題だと思う2次元座標を値にマッピングする機械学習アルゴリズム

(41.140359, -8.612964) -> 65 
... -> ... 

などのトレーニングデータの約1万行を持っているので、私はよく分かりません。

このインスタンスで使用するアルゴリズム(またはアルゴリズムのカテゴリ)は何ですか?

+0

私は[PCA](https://en.wikipedia.org/wiki/Principal_component_analysis)があなたが探しているものだと思います。 –

+1

私はまず、あなたのデータのサブサンプルを視覚化して、目に見えるパターンがあるかどうかを確認したいと思います。私の見方は、ターゲット値が場所の点でいくつかのパターンを持っている場合、最も近い隣人が働くかもしれないということです。 –

+0

@AlbertoBonsantoどのように使用するのか分かりませんが、明確にすることはできますか?それはデータをより低い次元に投影するのに使用されているようですが、そうですか? – parchment

答えて

0

これは回帰の問題で、自由に使用できます。それを解決するためにlinear regression。例は1次元であることが多いため、理解しやすいですが、任意の次元数で動作します。

1

関数を見つけようとする前に、pythonプロットのExcelにデータをプロットすると、探している関数の種類がわかることがあります。

さらに、excelに回帰計算モジュールがあります。

0

まず、線形回帰を使用できます。

numpy.linalg.lstsqを使用した例を与えることができます:

>>> import numpy as np 
>>> x = np.random.rand(10, 2) 
>>> x 
array([[ 0.7920302 , 0.05650698], 
     [ 0.76380636, 0.07123805], 
     [ 0.18650694, 0.89150851], 
     [ 0.22730377, 0.83013102], 
     [ 0.72369719, 0.07772721], 
     [ 0.26277287, 0.44253368], 
     [ 0.44421399, 0.98533921], 
     [ 0.91476656, 0.27183732], 
     [ 0.74745802, 0.08840694], 
     [ 0.60000819, 0.67162258]]) 
>>> y = np.random.rand(10) 
>>> y 
array([ 0.53341968, 0.63964031, 0.46097061, 0.68602146, 0.20041928, 
     0.42642768, 0.34039486, 0.93539655, 0.29946688, 0.57526445]) 
>>> m, c = np.linalg.lstsq(x, y)[0] 
>>> print m,c 
0.605269341974 0.370359070752 

はプロットし、どのようなこれらの値が表すの詳細については、マニュアルを参照してください。