2009-07-23 19 views
6

私はいくつかの(x、y)データポイントの回帰係数(切片と勾配)を最小二乗法を使って計算するためにかなり簡単なSQLコードを使用しています。これにより、私はデータに最適な最適なラインが得られます。しかし、我々はベストフィットのライン(下の曲線)の95%と5%の信頼区間を見ることができるようにしたいと考えています。SQLの線形回帰信頼区間

link text http://www.curvefit.com/2a03be60.gif

何これらが意味することは、真のラインは上の曲線の下にある95%の確率と下側の曲線より上である95%の確率を有することです。これらの曲線をどのように計算できますか?私はすでにウィキペディアなどを読み、いくつかのグーグルを行っているが、私はこれを計算することができる理解できる数学的方程式を見つけていない。

編集:ここに私が今いるものの本質があります。

--sample data 
create table #lr (x real not null, y real not null) 
insert into #lr values (0,1) 
insert into #lr values (4,9) 
insert into #lr values (2,5) 
insert into #lr values (3,7) 

declare @slope real 
declare @intercept real 

--calculate slope and intercept 
select 
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/ 
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)), 
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/ 
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x) 
from #lr 

ありがとうございます。

答えて

0

このサイトを試して、真ん中までスクロールしてください。あなたのベストフィットラインの各ポイントについて、Z、サンプルサイズ、および標準偏差を知っています。

http://www.stat.yale.edu/Courses/1997-98/101/confint.htm

+0

これはデッドリンクです。 – DatumPoint

+0

そうです!私はそれを思い出していない。ごめんなさい。 – PowerUser

0

@PowerUser:彼がいない1変数のセットアップのために、2変数のセットアップのための方程式を使用する必要があります。

マット:私に古い統計学科の教科書があれば、あなたが望むものを伝えることができます。残念ながら、私はそれを私と持っていないし、私は私の高校の統計コースから私のメモを持っていません。一方、私が覚えていることから、回帰直線の傾きの信頼区間のためのものしかなかったかもしれません...

とにかく、このページはうまくいくらか助けになるでしょう:http://www.stat.yale.edu/Courses/1997-98/101/linregin.htm