如何进行样本均值与协方差矩阵的估计?
admin888
|如何进行样本均值与协方差矩阵的估计?
在这一小节里,我们考虑一些对于更成功进行样本均值与协方差矩阵的估计以及实际中所遇到的高级估计具有重要作用的技术。
具有异方差与自相关性的一致协方差矩阵估计量
金融收益序列会表现出序列相关性与异方差性。序列相关也被称为自相关,是指个证券在一系列相连的时间间隔上的收益与它自身的相关性。异方差的存在意味着方差与协方差不是常量而是随着时间而变化。这两个效应导致估计的协方差矩阵是有偏的。幸运的是,现在存在简单而直接的技术几乎会自动地纠正这些偏差。
可能现在最流行的技术包括由 Newey和West提出的方法,以及由 Andrews进行推广、在金融文献中通常被称为“ Newey-West修正”的方法。
缺失和截短数据处理
实践中,我们不得不面对没有任何数据序列是完美的这样事实。比如存在缺失的和错误的观察值,或者仅仅是没有足够的数据。如果没有引起注意,这将会导致模型估计得较差和较差的投资表现。通常地,为了便于实际使用而处理数据序列的工作是单调乏味的但却又是非常重要的。一些统计技术可用于解决缺失的观察值;所谓的期望最大化算法是金融应用中最流行的技术之一。
对于发达国家里历史悠久的公司,其长期的日收益率数据序列通常是可得到的。但是,如果我们转向新成立的公司或者新兴市场中的公司,情况往往就不是这样了。比如我们有一个由10种资产构成的投资组合,其中5种资产有10年的历史收益数据,而其他5种资产却差不多只有3年的历史收益数据。我们可以通过截短序列使得所有序列长度都为3年,然后计算样本协方差矩阵。但是通过使用Stambaugh提出的方法,我们可以比那做的更好。简洁地说,从截短的样本协方差矩阵开始,这种技术利用所有可利用的数据对协方差矩阵进行了改进。
数据频率
Merton指出即使期望收益始终是常量,为了给出它们更加准确的估计,长期的历史数据还是需要的。对于方差和协方差来讲,情况就很不一样。在合理的假定条件下,以发现这些变量的估计值可以通过增加取样的频率来改善。
但是,并不是每个人都能得到高频率或者逐笔数据。通过使用每日的最高价、最价、开盘价和收盘价以及交易成交量可以获得一个改善的波动率的估计量。这些类型的估计量通常称为Garman-Klass估计量。
也可以从期权定价的文献中获得启示。正如Burghardt和Lane所指出的那样,当出于期权定价目的来估算历史波动性时,抽样的时间长度应该等于期权到期的时间。
正如Butler和Schachter所指出的那样,当历史数据用于波动率预测的目的时,估计量中的偏差倾向于随着样本长度增加而增加。但是,使用基于太短时间区间上的信息也是有问题的。在这种情况下,波动率的估计量往往对短期状况呈现出高度敏感性,比如反应过度和反应不足的修正。
牛市通网是一个牛股推荐网与低风险投资知识网,可以在线联系客服领取牛股。牛市通网从权威的投资专家、金融分析师等投资信息中挑选优质的文章进行发布。牛市通网主要为投资者提供股票知识、股票观点、股票分析和明智金融投资讨论等信息。