私はいくつかの(x、y)データポイントの回帰係数(切片と勾配)を最小二乗法を使って計算するためにかなり簡単なSQLコードを使用しています。これにより、私はデータに最適な最適なラインが得られます。しかし、我々はベストフィットのライン(下の曲線)の95%と5%の信頼区間を見ることができるようにしたいと考えています。SQLの線形回帰信頼区間
link text http://www.curvefit.com/2a03be60.gif
何これらが意味することは、真のラインは上の曲線の下にある95%の確率と下側の曲線より上である95%の確率を有することです。これらの曲線をどのように計算できますか?私はすでにウィキペディアなどを読み、いくつかのグーグルを行っているが、私はこれを計算することができる理解できる数学的方程式を見つけていない。
編集:ここに私が今いるものの本質があります。
--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)
declare @slope real
declare @intercept real
--calculate slope and intercept
select
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr
ありがとうございます。
これはデッドリンクです。 – DatumPoint
そうです!私はそれを思い出していない。ごめんなさい。 – PowerUser