您当前的位置:股票 > 财经资讯 > 财经频道

什么是分类回归树?它可以克服哪些局限?

2024-06-15 23:17:50 来源: 作者: admin888
分享到
关注牛市通网在线:
  • 扫描二维码

    关注√

    牛市通网微信

在线咨询:
  • 扫描或点击关注牛市通网在线客服

什么是分类回归树?它可以克服哪些局限?

采用回归分析的局限性之一是它从平均的角度来处理我们想要去预测其值的变量换言之,根据设计将解释变量和回归系数进行线性组合得到一个平均效应。此外,由于只解释平均效应,在回归中解释变量间线性组合使得很难考虑解释变量间的相互作用或者去检查在一个条件基础下的关系。

通常被称为分类回归树(CART)的方法可以克服回归分析的这些局限,它允许人们(1)研究非线性行为,(2)考虑解释变量间的相互作用,(3)检验条件基础下的关系。CART是在第一章中讨论的调查研究受访者时所使用的方法之一。

CART通过建立决策树(用于回归目的) 来预测因变量和(用于分类目的) 获得分类预测变量。CART是一个指导式学习方法。这意味着CART方法建立于一个具有已知分类或回归值的已知样本上。当模型建立后, 它被用于新的情况。在新的情况中, CART 规则用于预测,输出结果是一个分类或回归值。

CART允许人们通过使用一系列“如果一则”决策规则这一复杂的树形结构数据分析技术来研究基于条件的关系。“如果一则”规则是分析不确定条件下复杂问题的自然方法。这种方法可以使得研究者有效地确定对于感兴趣变量(也就是因变量)的最显著的影响。例如, 在股票投资的应用中, 感兴趣的变量是股票市场的行为。CART可帮助投资组合经理确定什么是影响股票市场的更重要因素, 例如, 是经济还是股票价值。CART 能估计可能影响因变量的因素的恰当等级,并指派概率。

据我们所知, Sorensen, Mezrich和Miller是最早将CART应用于数量化投资管理的。他们将其应用于基于传统资源配置目的的相对价值分析,这是数量化投资管理中最普遍的问题之一。具体的应用是建立最优决策树来对S&P500相对于现金的相对表现建模。他们将相对价值定义为S&P500的收益率减去长期公债收益率,高的相对价值预示着未来股票市场的更好地表现。该模型的结果分配概率给三种市场状态:表现好、表现差和中性。他们想要回答的问题是我们之前提到过的:什么因素在驱动股票市场中更重要,经济还是股票价值(以市盈率测量)?他们发现,例如,价值的关联性次于经济。就是说,在强势经济中,投资者不会那么关心市场的市盈率。

为了大致了解CART模型, 我们简要描述一下Sorensen, Mezrich和Miller所做的工作。他们首先确定了是股票收益的主要决定因素的解释变量。他们所使用的解释变量有收益率曲线的倾斜度、信用差价、股票风险溢价和股息率溢价(也就是,S&P500的股息率减去长期公债收益率) 。然后用CART将因变量, 即股票收益率分到两个不同的组,每一组尽可能地同质。为了实现这个目的,要确定解释变量的一个临界水平来分解因变量。CART算法接下来继续将这两个子组中的每一个分为更细的子组, 使得每组在统计上是可区分的,但是组内是同质的。分解继续直到根据额外的解释变量的分解不能再改善每个子组的统计同质性。得到的解释变量的分层结构使得整棵树有最小的误分类率。CART的最终结果是一个非线性的“如果一则”规则的树形结构层次, 其中每一个规则根据它之前的规则决定其行为。从这个树形结构层次中,可以得到到达因变量的每个状态的一组概率值。在Sorensen,Mezrich和Miller的应用中,它是赋予三个市场状态的概率:表现好、表现差和中性。他们称,当表现好的预测概率超过70%时,模型在几乎70%的时间里是正确的。

牛市通网是一个牛股推荐网与低风险投资知识网,可以在线联系客服领取牛股。牛市通网从权威的投资专家、金融分析师等投资信息中挑选优质的文章进行发布。牛市通网主要为投资者提供股票知识、股票观点、股票分析和明智金融投资讨论等信息。

责任编辑:admin888 标签:什么是分类回归树?它可以克服哪些局限?
广告

热门搜索

相关文章

广告
牛市通网 |财经频道

什么是分类回归树?它可以克服哪些局限?

admin888

|

什么是分类回归树?它可以克服哪些局限?

采用回归分析的局限性之一是它从平均的角度来处理我们想要去预测其值的变量换言之,根据设计将解释变量和回归系数进行线性组合得到一个平均效应。此外,由于只解释平均效应,在回归中解释变量间线性组合使得很难考虑解释变量间的相互作用或者去检查在一个条件基础下的关系。

通常被称为分类回归树(CART)的方法可以克服回归分析的这些局限,它允许人们(1)研究非线性行为,(2)考虑解释变量间的相互作用,(3)检验条件基础下的关系。CART是在第一章中讨论的调查研究受访者时所使用的方法之一。

CART通过建立决策树(用于回归目的) 来预测因变量和(用于分类目的) 获得分类预测变量。CART是一个指导式学习方法。这意味着CART方法建立于一个具有已知分类或回归值的已知样本上。当模型建立后, 它被用于新的情况。在新的情况中, CART 规则用于预测,输出结果是一个分类或回归值。

CART允许人们通过使用一系列“如果一则”决策规则这一复杂的树形结构数据分析技术来研究基于条件的关系。“如果一则”规则是分析不确定条件下复杂问题的自然方法。这种方法可以使得研究者有效地确定对于感兴趣变量(也就是因变量)的最显著的影响。例如, 在股票投资的应用中, 感兴趣的变量是股票市场的行为。CART可帮助投资组合经理确定什么是影响股票市场的更重要因素, 例如, 是经济还是股票价值。CART 能估计可能影响因变量的因素的恰当等级,并指派概率。

据我们所知, Sorensen, Mezrich和Miller是最早将CART应用于数量化投资管理的。他们将其应用于基于传统资源配置目的的相对价值分析,这是数量化投资管理中最普遍的问题之一。具体的应用是建立最优决策树来对S&P500相对于现金的相对表现建模。他们将相对价值定义为S&P500的收益率减去长期公债收益率,高的相对价值预示着未来股票市场的更好地表现。该模型的结果分配概率给三种市场状态:表现好、表现差和中性。他们想要回答的问题是我们之前提到过的:什么因素在驱动股票市场中更重要,经济还是股票价值(以市盈率测量)?他们发现,例如,价值的关联性次于经济。就是说,在强势经济中,投资者不会那么关心市场的市盈率。

为了大致了解CART模型, 我们简要描述一下Sorensen, Mezrich和Miller所做的工作。他们首先确定了是股票收益的主要决定因素的解释变量。他们所使用的解释变量有收益率曲线的倾斜度、信用差价、股票风险溢价和股息率溢价(也就是,S&P500的股息率减去长期公债收益率) 。然后用CART将因变量, 即股票收益率分到两个不同的组,每一组尽可能地同质。为了实现这个目的,要确定解释变量的一个临界水平来分解因变量。CART算法接下来继续将这两个子组中的每一个分为更细的子组, 使得每组在统计上是可区分的,但是组内是同质的。分解继续直到根据额外的解释变量的分解不能再改善每个子组的统计同质性。得到的解释变量的分层结构使得整棵树有最小的误分类率。CART的最终结果是一个非线性的“如果一则”规则的树形结构层次, 其中每一个规则根据它之前的规则决定其行为。从这个树形结构层次中,可以得到到达因变量的每个状态的一组概率值。在Sorensen,Mezrich和Miller的应用中,它是赋予三个市场状态的概率:表现好、表现差和中性。他们称,当表现好的预测概率超过70%时,模型在几乎70%的时间里是正确的。

牛市通网是一个牛股推荐网与低风险投资知识网,可以在线联系客服领取牛股。牛市通网从权威的投资专家、金融分析师等投资信息中挑选优质的文章进行发布。牛市通网主要为投资者提供股票知识、股票观点、股票分析和明智金融投资讨论等信息。


财经频道