什么是偏回归系数 偏回归系数的简介

2017-03-10

偏回归系数是多元回归问题出现的一个特殊性质。那么你对偏回归系数了解多少呢?以下是由小编整理关于什么是偏回归系数的内容,希望大家喜欢!

偏回归系数的介绍

在多元回归分析中,随机因变量对各个自变量的回归系数,表示各自变量对随机变量的影响程度。

偏回归系数是多元回归问题出现的一个特殊性质,如何理解、辨认和求取偏回归系数正是本文要讨论的。为了简化问题,我们把对偏回归系数的讨论,限定为只有2个解释变量的系统,即建立的经济计量模型为Yi=β0+β1X1i+β2X2i+ui(1) 回归方程为^Yi=^β0+^β1X1i+^β2X2i(2)式中^βi(i=0,1,2)为偏回归系数。

偏回归系数的问答

一、X1增加一个单位引起Y的增加量肯定是偏回归系数^β1吗?

为了回答这个命题,首先,必须进行因素影响分析,即X1,X2对Y的作用关系分析。具体讲,这种作用关系有四种:其一是X1本身变化对Y的净作用;其二是X2的变化引起X1的相应变化。

二、X1变化对Yi的影响程度到底有多大呢?

首先,在考虑偏导数的时候,我们认为其他解释变量保持不变,即当做常数来处理(类似于微积分中的偏导数),本例中把X2看做常数,则X1变化一个单位,会引起Yi变化β1个单位,β1就为偏回归系数

偏回归系数的本质:就是自变量对因变量影响程度。但是,这种没有经过任何处理的回归系数因为有时自变量的变异程度和均数有时差别很大,直接用偏回归系数无法比较各个自变量影响程度。 所以,必须进行处理,即进行标准化,标准化后即可以直接比较。其实,还有许多系数,都是因为自变量量纲不同,需要进行标准化,例如偏相关系数等。

标准化回归系数理解方法

标准化回归系数(Beta值)在多元回归中被用来比较变量间的重要性,但是由于重要性这一词意义的含糊性,这一统计常被误用。

有时人们说重要性,是指同样的条件下,哪一个东西更有效。在提高教学质量上,是硬件条件更重要还是师资更重要?如果是师资更重要,那么同样的物力投在师资上就可以更快地提高教学质量。但是这里要比较的两者必须有同样的测量单位,如成本(元)。如果变量的单位不同,我们不能绝对地说那个变量更重要。不同单位的两个东西是不能绝对地比出高低轻重来。要想进行绝对地比较,就需要两个东西有着共同的测度单位,否则无法比较。

而标准化回归系数说的重要性则与上面的意义不同,这是一种相对的重要性,与某一特定的情况下,自变量间的离散程度有关。比如说,虽然我们不能绝对地说出教育和年资在决定收入上那一个一定是重要的,但如果现在大家的教育程度比较相似,那么在收入的决定上,工作年数就是决定因素;反之,如果工作年数没有太大区别,那么教育就成为了重要原因。这里的重要性是相对的,是根据不同情况而改变的。再举一个通俗的例子,研究者研究的是遗传因素和后天因素对于人成长的影响。那么在一个社会境遇悬殊巨大的环境中,有人在贫民窟成长,有人在贵族学校上学,那么我们会发现人格的大部分差异会从后天环境因素得到解释,而遗传的作用就相对较小;相反,如果儿童都是在一个相差不大的环境中长大的,你会发现,遗传会解释大部分的人格差异。这种意义上的重要性,不仅与这一自变量的回归系数有关系,而且还与这个自变量的波动程度有关系:如果其波动程度较大,那么就会显得较为重要;否则,就显得不太重要。标准化回归系数正是测量这种重要性的。从标准化回归系数的公式 中也可看出,Beta值是与自变量的标准差与成正比的,自变量波动程度的增加,会使它在这一具体情况下的重要性增加。

但是如果将两种重要性混同,就会得到误导性结论。如环境因素的Beta值比遗传因素的Beta值大,就认为在个体的人格发展上应更注意环境因素,而轻视遗传因素,在目前对于Beta值的错误观念非常流行,甚至是一些高手中。

标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。举例来说,从某一次数据中得出,在影响人格形成的因素中,环境因素的Beta值比遗传因素的Beta值大,这只能说明数据采集当时当地的情况,而不能加以任何不恰当的推论,不能绝对地不加任何限定地说,环境因素的影响就是比遗传因素大。事实上,如果未来环境因素的波动程度变小,很可能遗传因素就显得更为重要。数据的情况千差万别,变量的相对重要性也可能完全不同但都符合当时的实际情况。

更多相关阅读

最新发布的文章