大型协方差矩阵的估计问题有哪些?
admin888
|大型协方差矩阵的估计问题有哪些?
现在我们来讨论大型协方差矩阵的估计问题。例如,若要估计一个大型市场,比如美国股票市场中,股票间的协方差和相关系数,我们就会遇到如下问题:在这样的情形中,股票数量多达几百甚至几千。而周收益数据点的数量(实际收益的样本)至多有几百个。在考虑到实际收益的长时间序列时,存在两个主要问题。第一,在若千年的范围内,相关系数和协方差不可能保持恒定,因此实证的相关系数只是个平均值,但可能和期末的实际相关系数相差很大。第二,如果考虑长期,我们就只能选择那些在整个时期内都存在的股票。这造成估计存在显著偏差。我们可以得出结论,在金融时间序列中,样本数据的数目一般近似地与变量的数目相同。
当观察值的数目和变量的数目具有同数量级时,可以证明,协方差和相关系数的估计具有很大的不确定性。为了得到大型协方差矩阵估计不确定性的直观感受,考虑一个协方差矩阵(一个对称矩阵)的独立项个数是N(N+1)/2,这个数目随着股票数目的平方增长。例如,500只股票的协方差矩阵包含125250个独立项,而1000只股票的协方差矩阵包含500500个独立项。然而,用于估计协方差矩阵的数据点的总体数目仅随股票数目线性增长。例如,一个五年的日收益率样本大约包括1000个收益值。如果一个投资组合包含500只股票,将有500000个数据点去估计125250个独立项,每个独立项平均不到四个数据。考虑到这些数目,很显然,样本的统计波动导致大量的协方差估计值远离真实的协方差。
为了得到大型协方差矩阵的稳健估计,我们需要减少矩阵的维度,也就是说,我们需要减少独立项的数目。目前,人们想到一些方法。其中被广泛使用的方法是先估计协方差矩阵的特征值,并通过因素分析或主成分分析,重新得到一个稳健的协方差矩阵。估计协方差矩阵的问题因此转化为估计其特征值的问题。我们可以预料到,一个大型协方差矩阵的特征值表现出的是一种随机行为。这种随机行为的精确量化由随机矩阵理论(RMT)给出。实际上,RMT的主要结果之一就是特征值的渐近分布的计算。
随机矩阵的矩阵变量为随机变量。RMT最早提出是在20世纪20年代,以响应生物统计学和一般多元统计的具体应用需要。在20世纪50年代,RMT成为量子物理学中的一个重要工具。如今已被应用于很多科学领域,从量子力学、统计物理学、无线通信到数论和金融计量经济学。我们将简要概述RMT并给出与计量经济学有关的近期成果。
RMT理论给出的一个基本见解是, 如果观察值的数目接近于变量的数目, 当样本容量T和股票数量N保持恒定比率N/T地趋于无穷大时,由样本协方差矩阵计算得到的特征值并不收敛于真实特征值。这个N/T比率被称为纵横比。RMT区分了特征值的整体分布和边缘分布。让我们首先来讨论特征值的整体分布。特征值整体分布的结果可以总结如下。Anderson(1963) 证明, 当样本量趋于无穷大时, 一个N×N阶方阵的特征值的样本分布趋近于真实协方差矩阵的特征值分布。然而,如果样本量和协方差矩阵中项的数量都趋于无穷大,则样本特征值将不是真实特征值的一致估计量。
对于矩形矩阵的一个基本的渐进结果由Marcenko和Pastur所证明。他们证明,当矩阵规模趋于无穷大时,一个协方差矩阵的样本特征值的分布趋近于一个明确定义的分布。考虑一个T×N阶矩阵H,其项是独立同分布(i.i.d.)的实值或复值的零均值变量,方差为1/T,四阶矩为O(1/T2)。考虑矩阵A=HtH。由于矩阵H的项是独立同分布的变量, 则矩阵A的理论特征值都等于1。然而, Marcenko和Pastur证明, 当T, N→∞,N/T→γ时,矩阵A的特征值的渐近分布有如下的密度函数:
以上的结论已经通过不同的方法得到了扩展和精炼。例如, Silverstein在不假设四阶矩存在的情况下,证明了Marcenko Pastur关于相关矩阵的结论的一个扩展。假设TXN的矩阵H的项为独立同分布的实值或复值变量,且具有零均值、单位方差以及有限的四阶矩。令Tn为一个固定的NXN厄尔密特矩阵(Hermitian matrix)(如果是实数阵的话,为酉矩阵)
相似的结果已经由 Sengupta 和 Mitra得到。特征值的渐近分布为将有意义的特征值与仅是围绕理论值1噪声波动的特征值进行分离提供了基准。因此理解最大特征值的行为很重要。Marcenko Pastur 法则与位于最右边缘(最左边缘)的右边(左边)的一些离群特征值存在性是相容的。
后面的结论并没有告诉我们关于最大的特征值的渐近分布的任何情况。这个分布被称为 Tracy-Widom 分布,已经被确认为特定的微分方程的解。如果矩阵 H 是厚尾的,最大特征值的特性将完全改变。Soshnikov,Fyodorov和Soshnikov证明,最大特征值的分布弱收敛于一个泊松过程。Biroli, Bouchaud和 Potters 指出,一个其项的分布具有幂次分布的尾部特征的随机方阵,其最大特征值存在一个由 Tracy- Widom法则到尾部指数为4的 Frechet分布的相变。
上述结果描述了在矩阵H的项独立同分布的零假设下,最大特征值的特性。Bai和Silverstein证明,在相关矩阵H特征值的渐近分布支集的外部不存在特征值的情况下,对于相关矩阵存在相似的结论。考虑矩阵
这些结果证明,给定一个由N个变量的T个样本得到的大型样本协方差矩阵,我们可以建立一个基准区间,使得只有那些位于区间以外的样本特征值可以被可靠地看作是对不等于1的真实特征值的估计,因此,有助于求解真实的相关系数。
牛市通网是一个牛股推荐网与低风险投资知识网,可以在线联系客服领取牛股。牛市通网从权威的投资专家、金融分析师等投资信息中挑选优质的文章进行发布。牛市通网主要为投资者提供股票知识、股票观点、股票分析和明智金融投资讨论等信息。