血红蛋白病

注册

 

发新话题 回复该主题

逐步回归法在研究儿童体内血红蛋白浓度的应 [复制链接]

1#

逐步回归法:

试验原理:逐步回归分析的实施过程是每一步都要对已引入回归方程的变量计算其偏回归平方和(即贡献),然后选一个偏回归平方和最小的变里,在预先给定的F水平下进行显著性检验,如果显著则该变量不必从回归方程中剔除,这时方程中其它的几个变量也都不需要剔除因为其它的几个变量的偏回归平方和都大于最小的一个更不需要剔除)。相反,如果不显著则该变量要剔除,然后按偏回归平方和由小到大地依次对方程中其它变量进行F检验。将对Y影响不显著的变量全部剔余,保留的都是显著的。接着再对未引人回归方程中的变量分别计算其偏回3平方和,并选其中偏回归平方和最大的一个变量,同样在给定F水平下作显著性检验,如果显著则将该变里引入回归3方程,这一过程一直继续下去,直到在回归方程中的变量都不能剔除而又无新变里可以引入时为止,这时逐步回归过程结束。

实验内容:为了研究钙、铁、铜等人体必需元素对婴幼儿身体健康的影响,随机抽取了30个观测数据,基于多元线性回归分析的逐步回归分析方法,对儿童体内几种必需元素与血红蛋白浓度的关系进行分析研究。这里,被解释变量为血红蛋白浓度,解释变量为钙、铁、铜。该实验数据见表1。

程序代码或实现过程:

(1)导入数据:打开SPSS→点击“文件”选择“导入数据”,导入Excel“血红蛋白浓度”数据文件→点击“确定”完成导入数据。

(2)建立散点图:点击“图形”选择“旧对话框”→把“血红蛋白”当做Y轴,“钙、铁、铜”当做X轴→点击“完成”导出散点图。(如图1.2)

(3)回归分析:点击“分析”,在“回归”中选择“线性”→在弹出的对话框中,将“血红蛋白”填入因变量中,“钙、铁、铜”填入自变量中,在“方法”中选择“输入”→点击“确定”,完成简单的回归分析。

(4)模型检验:在“统计”中,选择估计以“输出回归系数B的估计值、t统计量”等,选择“德斌-沃森”以进行DW检验→点击“确定”完成模型的检验。

(5)检验误差变量:在“图”中选择“直方图和正态概率图”以绘制标准化残差的直方图和残差分析与正态概率比较图,以“标准化预测”为纵坐标,“标准化残差值”为横坐标,绘制残差与Y的预测值的散点图→点击“确定”检验误差变量的方差是否为常数。

结果分析:

散点图:

由钙和血红蛋白的之间的散点图可以看出:图中的点分布较为分散,但可以看出在某一条直线周围,并且直线走向是从右下角到左上角。因此可以初步判段二者之间成负相关关系。血红蛋白浓度随着钙浓度数的增加而增加。

由铁和血红蛋白的之间的散点图可以看出:图中的点分布在某一条直线周围,并且直线走向是从左下角到右上角。因此可以初步判断二者之间成正相关关系。血红蛋白浓度随着铁浓度的增加而增加。

由铜和血红蛋白的散点图之间的散点图可以看出:图中的点分布在某一条直线周围,因此可以初步判断二者之间存在相关关系。

简单回归分析:

由系数表可以看出:在显著性水平为0.05的条件下,钙、铜显著性分别为:0.、0.,二者的显著性均大于0.05,因此可以判定二者具有显著性。反之,铁的显著性小于0.05,可以判定铁显著性水平不高。

由系数表可以得到多元线性回归方程:

逐步回归:

该表显示模型最先进入变量为铁,剔除了钙和铜的变量

由表可知,相关系数R为0.,说明自变量与因变量有比较好的相关性。R方为0.,接近于1,说明总体回归效果较好,Durbin-Watson检验统计量为0.,偏离2,向0的方向接近,则提示残差不独立。

表4是用方差分析对整个回归方程做了显著性检验,其中F=18.,对应的概率P值近似为0。若显著性水平a为0.05,则因概率小于a,拒绝回归方程显著性检验的原假设,即回归系数不同时为0,解释变量全体与被解释变量存在显著的线性关系,选择线性模型具有合理性。

由系数表可以得到多元线性回归方程

从残差统计表中可以得知预测值、残差、标准预测值和标准残差的最大、最小值、平均值和标准偏差。

该图为回归标准化残差的直方图,用来判断标准化残差是否呈正态分布。由上图可以判断,标准化残差呈正态分布。

该图为回归标准化的正态P-P图,该图给出了观测值的残差分布与假设的正态分布的比较。由上图可知,标准化残差散点分布靠近直线,因而可以判断标准化残差呈正态分布。

由标准残差与标准y之间预测图可以看出:随着y的变化残差无明显变化,因此残差变量的方差为常数,不具有异方差性。

本文由咸鱼爱应统原创,喜欢就点个赞吧!希望对大家有帮助

分享 转发
TOP
发新话题 回复该主题