对常见的数据问题应该怎样处理?
admin888
|对常见的数据问题应该怎样处理?
大多数的数据集都容易受到质量问题的影响。为了有效地开展工作,我们需要熟悉数据的定义和数据库的设计。我们还需要使用一些方法来减小可能引发错误结论的数据问题的潜在影响。
首先我们应该熟悉数据供应商收集和处理数据的标准化流程。比如,许多数据供应商使用不同的模板来存储数据。具体说来, Compustat US数据库使用一个模板报告收入报表数据,而 Worldscope Globa数据库则使用四个不同的模板,这取决于公司被分到银行、保险公司、工业公司或者其他金融公司中的哪一类。使用者需要熟悉的与数据标准化有关的其他问题还包括:
数据的来源是什么??公开的财务报表、监管文件、新闻专题报道或其他来源?
是否有统一的报告模板?
从信息公布到它能在数据库中被使用之间有多久的延时?
数据是否因为股票分割而被调整过?
已经不存在或是不活跃公司的历史数据是否可获得?
对于拥有多种股票的公司是如何处理其数据的?
用于汇总数据的方法是什么?
了解处理数据时所依据的会计原理是至关重要的。估值方法和数据披露是这里涉及的两个重要的原理。对于估值,我们应了解各个会计科目使用的成本准则的类型。具体来说对于资产,是应选用历史成本准则、公允价值会计准则还是其他标准来计算呢?对于信息披露的有关会计原则,我们则需要了解会计术语的定义、账目的格式以及一些更具体的细节。
研究人员利用财务报表构建因素时应先回顾以下基本会计原则的发展历史。比如,公司披露的现金流量表多年来已经发生了一些变化。在1988年7月15日之前的财政年度生效的85#财务会计标准(SFAS#85)要求公司必须披露现金流量表。在采用这个会计标准之前,公司可以披露以下三个报表中的一个:营运资金报表、包括资金来源和使用情况的现金表或者包含经营活动的现金表。对任何包含现金流量项目的因素进行历史分析时都需要根据公司所采用报表的不同而对因素的定义进行调整。
我们更好的选择则是采用自动化流程以减少数据问题的潜在影响。我们需要检验数据的一致性和准确性。可以通过观察离群值和寻找缺失的数据对单个因素的时间序列进行分析。我们可以采用幅度测试比较当前的数据项与之前时期同一数据项的区别,从而找出大于预定方差的数据。当找出可疑项之后我们就应研究错误产生的原因以及能够做出的改进。
牛市通网是一个牛股推荐网与低风险投资知识网,可以在线联系客服领取牛股。牛市通网从权威的投资专家、金融分析师等投资信息中挑选优质的文章进行发布。牛市通网主要为投资者提供股票知识、股票观点、股票分析和明智金融投资讨论等信息。