有哪几种方法利用样本来评估经典回归的质量?
admin888
|有哪几种方法利用样本来评估经典回归的质量?
我们已经估计了一个回归模型,但还需要检验回归的质量。下面几种经典的方法利用样本来评估经典回归的质量:
为了计算回归诊断量,我们需要对回归变量的分布做出假设。实践中是假定残差服从正态分布。
在残差彼此不相关并且与回归因子不相关(如果后者是随机变量)的假设下,回归系数由
在实践中,大多数统计软件包都会计算被估计的回归系数的 N维向量
和包含在规定的置信水平下的相对置信区间的一个 N × 2 阶矩阵
R2统计量,也称为可决系数,度量的是由回归解释的因变量的全变差的百分比。考虑一个单一方程式的多元回归。如果要评估回归拟合数据的好坏如何,我们可以比较残差的全变差和数据的全变差。使用本章的记号,我们称Y为自变量,U为残差。残差的全变差和因变量的全变差之间的比率
度量了没有被回归解释的数据方差的百分比。因此,量
度量了由回归方程解释的因变量的全变差的百分比。
以这种方式定义的R2容易产生误导,而且可能导致严重的过度拟合。实际上,利用样本解释的全变差的百分比随回归因子的数目增加而提高。然而,这种方式产生的R2的提高可能是一个数字假相。由于这个原因,有人提出调整 R2,惩罚使用很多回归因子的模型。在大多数软件包中所使用的 修正的R2或者 调整的R2定义如下∶
其随着回归因子的数目增长而变小。
F 统计量是一个大多数统计软件包都会计算的,用于检验所有回归系数都为零;B=0 这一零假设的统计量。完全的 F统计量被定义如下∶
可以证明, F统计量的分布为F分布F(K-1,N-K) ,它允许人们确定相对的p.值。p值是在统计量取值右侧的分布尾部的概率。大多数的统计软件包都能计算F统计量并由F分布计算相应的p值。若p值很小则拒绝零假设B=0,因为它意味着计算的统计量非常不可能远在尾部区域给出。
牛市通网是一个牛股推荐网与低风险投资知识网,可以在线联系客服领取牛股。牛市通网从权威的投资专家、金融分析师等投资信息中挑选优质的文章进行发布。牛市通网主要为投资者提供股票知识、股票观点、股票分析和明智金融投资讨论等信息。