私は相関関係を見つけたいと思う2組のデータを持っています。かなりのデータの分散がありますが、明らかに関係があります。私は現在、numpy polyfit(8次)を使用していますが、適切でない行(特に先頭と末尾)の「揺れ」があります。第二に、私はフィットカーブはやや急勾配でなければなりません(行の先頭に非常によくではないと思います。spline through scatter
を、私は、これらのデータ点を通るベストフィット「スプライン」を取得できますか?
私の現在のコード:。
# fit regression line
regressionLineOrder = 8
regressionLine = np.polyfit(data['x'], data['y'], regressionLineOrder)
p = np.poly1d(regressionLine)
:ここ
は単純な例でありますフィット。より良いカーブが必要な場合は、より高度な回帰手法を使用する必要があります。 [scikit-learn](http://scikit-learn.org/stable/)にはいくつかのアルゴリズムがあります。 [Gaussian processes](https://en.wikipedia.org/wiki/Gaussian_process)は良い選択ですが、直接使用するにはあまりにも多くのデータが必要です。 – jdehesa