式(7-1)就是多元线性回归的数字模型。(二)建立多元线性回归方程设y对x1,x2,…,m)称为高斯乘数,是多元线性回归分析假设检验与进一步统计分析所需要的。建立产量y与穗数x1、每穗粒数x2的二元线性回归方程。如果此回归关系是真实的,则可依据该二元线性回归方程由穗数x1、每穗粒数x2预测和控制产量y。统计学已证明,在m元线性回归分析中,离回归平方和的自由度为。......
2023-11-17
一、多元线性回归关系的假设检验
在根据因变量与多个自变量的实际观测值建立多元线性回归方程时,因变量与多个自变量间的线性关系只是一种假设,尽管这种假设常常不是没有根据的,但是在建立了多元线性回归方程之后,还必须对因变量与多个自变量间的线性关系的假设进行检验,也就是对多元线性回归关系进行假设检验,或者说对多元线性回归方程进行假设检验。这里采用F检验法。
与直线回归分析一样,在多元线性回归分析中,因变量y的总平方和SS可以分解为回归平方和SSR与离回归平方和SS,两部分,即
因变量y的总自由度dfr,也可以分解为回归自由度dfR与离回归自由度dfr,两部分,即
式(7-10)、式(7-11)合称为多元线性回归的平方和与自由度的分解式。
在式(7-12)中,SSy=∑(y-)2反映了因变量y的总变异;SSR=∑(y-
)2反映了因变量与多个自变量间存在线性关系所引起的变异;SSr=∑(y-
)2反映了除因变量与多个自变量间存在线性关系以外的其他因素(包括试验误差)所引起的变异。
(7-12)中各项平方和的计算公式如下
式(7-12)中各项自由度的计算公式如下:
dfy=n-1
dfR=m
dfr=n-m-1
在上述计算公式中,m自变量的个数,n为实际观测值的组数。
在计算出SSR、dfR、SSr、dfr之后,我们可以算出回归均方MSR与离回归均方MSr
检验多元线性回归关系是否显著,就是检验各自变量的总体偏回归系数βi(i=1,2,…,m)是否同时为零,假设检验的无效假设与备择假设为
H0:β1=β2=…=βm=0,HA:β1,β2,…,βm不全为零
在H0成立条件下,有
由上述统计数F进行F检验即可推断多元线性回归关系的显著性。
[例6]对[例5]所建立的二元线性回归方程进行假设检验。
因为 SSy=25996.9334,SP1y=-35.03,SP2y=4372.50
SSR=b1SP1y+b2SP2y
=24.9679×(-35.03)+5.2381×4372.50
=222 089 667
SSr=SSy-SSR
25996.9334-22028.9667
=39678.9667
而
dfy=n-1=15-1=14
dfR=m=2
dfr=n-m-1=15-2-1=12
列出二元线性回归方差分析表,进行F检验。
表7-2中,F=33.310 2>F0.01(2,12),p<0.01,否定H0,即[例6]资料的产量y(kg/667 m2)与穗数x1(万/666.7 m2)、每穗粒数x2之间存在极显著的线性关系。
表7-2 二元线性回归方差分析表
二、偏回归系数的假设检验
上述多元线性回归关系假设检验是检验各自变量共同对因变量的线性影响是否显著。如果经过F检验多元线性回归关系显著,但不一定每一个自变量与因变量的线性关系都显著,这并不排斥其中存在着与因变量线性关系不显著的自变量的可能性。因此,当多元线性回归关系显著时,还必须逐一对各个偏回归系数进行假设检验,发现并剔除对因变量的线性影响不显著的自变量。(www.chuimin.cn)
对偏回归系数b(i=1,2,…,m)进行假设检验有两种等价的方法——t检验和F检验。无论采用t检验或F检验,无效假设为
H0:βi=0,HA:βi≠0(i=1,2,…,m)
(一)t检验
t检验计算公式为
其中,sb1=sr为偏回归系数标准误,ci1为C=A-1的主对角线元素。
[例7]采用t检验法对[例5]的偏回归系数b1=24.967 9和b2=5.238 1进行假设检验
先计算[例5]所建立的二元回归方程的离回归标准误sr。
在[例6]中已算出SSr=3 967.9 667,因而
又因为c11=0.06 097 906,c22=0.00 124 763
所以
于是
根据以df=n-m-1=12,查t值表,得t0.05(12)=2.179,t0.01(12)=3.055。因为tb1、tb2均大于t0.01(12)=3.055,所以因变量y对自变量x1、x2的偏回归系数b1、b2都极显著,即产量对穗数和穗粒数的偏回归都是极显著的。
(二)F检验
设SSR为m个自变量x1,x2,…,xm的回归平方和,SSR为去掉一个自变量xi后m-1个自变量的回归平方和,它们的差SSR-SSR为去掉自变量xi之后回归平方和减少的量,称为自变量xi的偏回归平方和,记为SSb1,即
SSb1=SSR-SSR
可以证明
注意,在一般情况下,各自变量xi的偏回归平方和SSb1之和不等于回归平方和SSR,即
利用下述统计数F检验各偏回归系数显著性
可以将上述F检验列成方差分析表的形式。
[例8]采用F检验法对[例5]的偏回归系数b1=24.967 9和b2=5.238 1进行假设检验。
先计算y对x1和x2的偏回归平方和
而df1=df2=2,已计算得SSr=3 967.966 7,dfr=12,于是,列出方差分析表(表7-3),进行偏回归系数假设检验——F检验。
表7-3 偏回归方差分析表
因为Fb1、Fb2均大于F0.01(1,12)=9.33,所以,因变量y对自变量x1、x2的偏回归系数b1、b2都极显著,即产量对穗数、穗粒数的偏回归都是极显著的。
多元线性回归关系的假设检验——F检验的方差分析表与偏回归系数的假设检验——F检验的方差分析表常常合并为一个表见表7-4。
表7-4 二次元线性回归方差分析表
偏回归系数假设检验的t检验与F检验是等价的,在检验偏回归系数的显著性时,任选一种方法进行。
有关生态数据分析与建模的文章
式(7-1)就是多元线性回归的数字模型。(二)建立多元线性回归方程设y对x1,x2,…,m)称为高斯乘数,是多元线性回归分析假设检验与进一步统计分析所需要的。建立产量y与穗数x1、每穗粒数x2的二元线性回归方程。如果此回归关系是真实的,则可依据该二元线性回归方程由穗数x1、每穗粒数x2预测和控制产量y。统计学已证明,在m元线性回归分析中,离回归平方和的自由度为。......
2023-11-17
多元线性回归的数学模型可以用矩阵形式表示为1.参数β的最小二乘估计设b0,b1,…表4-1 回归正交设计计算表通过推导,可以得到方差分析表4-2。表4-2 方差分析表3.回归方程的显著性检验F>Fα 若式成立,我们可以认为在显著水平α下,线性回归方程(4-6)是有显著意义的。反之,则认为线性回归方程没有什么意义,这时需要查明原因,具体情况具体分析。......
2023-06-27
直线回归是回归分析中最简单的一种,又称为简单回归。(一)直线回归方程散点图上呈现直线趋势的两个变数,自变量x的每一个取值都有y的一个分布与之对应。试计算其直线回归方程。为简化手续,可从以下恒等式得出:(五)直线回归的数学模型和基本假定回归分析的依据是直线回归模型。......
2023-11-17
在多数生态学文献中,回归分析方面的问题是所有应用统计学中出现频率最高的问题。R2实际上是一个相对的度量,它表示回归平方和占总平方和的百分比。......
2023-11-17
所以对于样本的回归方程,必须测定其来自无直线回归关系总体的概率大小。所以对直线回归的假设测验为H0:β=0对HA:β≠0由(6-3)式可推得回归系数b的标准误Sb为:而遵循ν=n-2的t分布,故由t值即可知道样本回归系数b来自β=0总体的概率大小。所以,对直线回归作假设测验,只需选择上述测验方法之一即可。......
2023-11-17
在实验4.4.1中曾对R 自带的stackloss数据集进行了逐步回归,现在我们在实验4.4.1的基础上进行回归诊断.(1)画回归诊断图>opar<-par(mfrow=c(2,2))>plot(lm.step,1:4)>par(opar)结果如图4-2所示.图4-2回归诊断图分析4张回归诊断图(图4-2).第1张是残差图,得到的残差图呈喇叭口形状,属于异方差情况(这样的数据需要作Box-Cox......
2023-11-18
在实验2.3.1中,我们对mtcars数据集进行了展示和描述.在实验2.3.3中,我们对mtcars数据集进行了可视化.现在我们对该数据集中的变量进行回归分析.(1)不考虑变量交互项对该数据集,如果把mpg(汽车每加仑公里数)作为因变量,自变量为hp(马力)和wt(汽车重量)进行回归.>fit<-lm(mpg~hp+wt,data=mtcars)>summary(fit)结果如下:得到的回归方程为......
2023-11-18
,Xp 来表示.在回归分析中,主要研究以下问题:确定Y 与X1,X2,…,Xp 之间的定量关系表达式,这种表达式称为回归方程;对所得到的回归方程的可信程度进行检验;判断自变量Xi(i=1,2,…,p)对因变量Y 有无显著影响;利用所求得的回归方程进行预测或控制.......
2023-11-18
相关推荐