首页 理论教育生态数据分析:多元线性回归的假设检验

生态数据分析:多元线性回归的假设检验

【摘要】:,βm不全为零在H0成立条件下,有由上述统计数F进行F检验即可推断多元线性回归关系的显著性。[例6]对[例5]所建立的二元线性回归方程进行假设检验。表7-2二元线性回归方差分析表二、偏回归系数的假设检验上述多元线性回归关系假设检验是检验各自变量共同对因变量的线性影响是否显著。因此,当多元线性回归关系显著时,还必须逐一对各个偏回归系数进行假设检验,发现并剔除对因变量的线性影响不显著的自变量。

一、多元线性回归关系的假设检验

在根据变量与多个自变量的实际观测值建立多元线性回归方程时,因变量与多个自变量间的线性关系只是一种假设,尽管这种假设常常不是没有根据的,但是在建立了多元线性回归方程之后,还必须对因变量与多个自变量间的线性关系的假设进行检验,也就是对多元线性回归关系进行假设检验,或者说对多元线性回归方程进行假设检验。这里采用F检验法。

与直线回归分析一样,在多元线性回归分析中,因变量y的总平方和SS可以分解为回归平方和SSR与离回归平方和SS,两部分,即

因变量y的总自由度dfr,也可以分解为回归自由度dfR与离回归自由度dfr,两部分,即

式(7-10)、式(7-11)合称为多元线性回归的平方和与自由度的分解式。

在式(7-12)中,SSy=∑(y-2反映了因变量y的总变异;SSR=∑(y-2反映了因变量与多个自变量间存在线性关系所引起的变异;SSr=∑(y-2反映了除因变量与多个自变量间存在线性关系以外的其他因素(包括试验误差)所引起的变异。

(7-12)中各项平方和的计算公式如下

式(7-12)中各项自由度的计算公式如下:

dfy=n-1

dfR=m

dfr=n-m-1

在上述计算公式中,m自变量的个数,n为实际观测值的组数。

在计算出SSR、dfR、SSr、dfr之后,我们可以算出回归均方MSR与离回归均方MSr

检验多元线性回归关系是否显著,就是检验各自变量的总体偏回归系数βi(i=1,2,…,m)是否同时为零,假设检验的无效假设与备择假设为

H0:β1=β2=…=βm=0,HA:β1,β2,…,βm不全为零

在H0成立条件下,有

由上述统计数F进行F检验即可推断多元线性回归关系的显著性

[例6]对[例5]所建立的二元线性回归方程进行假设检验。

因为 SSy=25996.9334,SP1y=-35.03,SP2y=4372.50

SSR=b1SP1y+b2SP2y

=24.9679×(-35.03)+5.2381×4372.50

=222 089 667

SSr=SSy-SSR

25996.9334-22028.9667

=39678.9667

dfy=n-1=15-1=14

dfR=m=2

dfr=n-m-1=15-2-1=12

列出二元线性回归方差分析表,进行F检验。

表7-2中,F=33.310 2>F0.01(2,12),p<0.01,否定H0,即[例6]资料的产量y(kg/667 m2)与穗数x1(万/666.7 m2)、每穗粒数x2之间存在极显著的线性关系。

表7-2 二元线性回归方差分析表

二、偏回归系数的假设检验

上述多元线性回归关系假设检验是检验各自变量共同对因变量的线性影响是否显著。如果经过F检验多元线性回归关系显著,但不一定每一个自变量与因变量的线性关系都显著,这并不排斥其中存在着与因变量线性关系不显著的自变量的可能性。因此,当多元线性回归关系显著时,还必须逐一对各个偏回归系数进行假设检验,发现并剔除对因变量的线性影响不显著的自变量。(www.chuimin.cn)

对偏回归系数b(i=1,2,…,m)进行假设检验有两种等价的方法——t检验和F检验。无论采用t检验或F检验,无效假设为

H0:βi=0,HA:βi≠0(i=1,2,…,m)

(一)t检验

t检验计算公式为

其中,sb1=sr为偏回归系数标准误,ci1为C=A-1的主对角线元素。

[例7]采用t检验法对[例5]的偏回归系数b1=24.967 9和b2=5.238 1进行假设检验

先计算[例5]所建立的二元回归方程的离回归标准误sr

在[例6]中已算出SSr=3 967.9 667,因而

又因为c11=0.06 097 906,c22=0.00 124 763

所以

于是

根据以df=n-m-1=12,查t值表,得t0.05(12)=2.179,t0.01(12)=3.055。因为tb1、tb2均大于t0.01(12)=3.055,所以因变量y对自变量x1、x2的偏回归系数b1、b2都极显著,即产量对穗数和穗粒数的偏回归都是极显著的。

(二)F检验

设SSR为m个自变量x1,x2,…,xm的回归平方和,SSR为去掉一个自变量xi后m-1个自变量的回归平方和,它们的差SSR-SSR为去掉自变量xi之后回归平方和减少的量,称为自变量xi的偏回归平方和,记为SSb1,即

SSb1=SSR-SSR

可以证明

注意,在一般情况下,各自变量xi的偏回归平方和SSb1之和不等于回归平方和SSR,即

利用下述统计数F检验各偏回归系数显著性

可以将上述F检验列成方差分析表的形式。

[例8]采用F检验法对[例5]的偏回归系数b1=24.967 9和b2=5.238 1进行假设检验。

先计算y对x1和x2的偏回归平方和

而df1=df2=2,已计算得SSr=3 967.966 7,dfr=12,于是,列出方差分析表(表7-3),进行偏回归系数假设检验——F检验。

表7-3 偏回归方差分析表

因为Fb1、Fb2均大于F0.01(1,12)=9.33,所以,因变量y对自变量x1、x2的偏回归系数b1、b2都极显著,即产量对穗数、穗粒数的偏回归都是极显著的。

多元线性回归关系的假设检验——F检验的方差分析表与偏回归系数的假设检验——F检验的方差分析表常常合并为一个表见表7-4。

表7-4  二次元线性回归方差分析表

偏回归系数假设检验的t检验与F检验是等价的,在检验偏回归系数的显著性时,任选一种方法进行。