经济数据与金融数据分析和处理要点,数据处理方法金融时间序列数据,既有季节因素问题,又存在序列平稳性问题。金融指标的月度或季度时间序列包含4种变动要素:长期趋势要素T、循环要素C、季节变动要素S和不规则要素I。因而在进行分析时,季节变动要素和不规则要素往往掩盖了经济金融发展中的客观变化,给研究和分析经济发展趋势和判断目前经济所处的状态带来困难。
随着计算机科学技术的迅猛发展以及在经济学中的应用,极大地改进了经济计量分析的技术手段,特别是高频数据的利用与时间序列计量模型的组合,使得金融计量学得到飞速发展,进而金融计量学发展为经济计量学的一个重要分支。金融计童学就是计量经济学中的方法和技术在金融领域中的应用。它可以用于检验经济学假说和金融理论,解释重要公认的金融现象,并对金融市场行为建模和预测。鉴于金融计量在现代金融学中重要地位,本文就金融计量分析在实际应用中需要注意的一些问题给出探讨。
一、经济数据类型与金融数据特征
众所周知,数据对于经济计量学的应用分析非常重要,且这种重要性无论怎样强调都不算过分,因而在进行计量分析之前首先要清楚所收集数据类型。不同类型的数据所对应的数据处理和计量分析方法也不同。目前,经济数据大致分为四种类型:一是横截面数据,指在给定时点上,对不同个体的某个变量的观察值。二是时间序列数据,指由一个或几个变量不同时间段的观察值。三是混合横截面数据,指横截面数据与时间序列数据的合并。四是综列数据(paneldata),指由横截面数据集中每个数据的一个时间序列组成。它与混合截面数据主要区别是同一横截面数据的数据单位都被跟踪了一段特定的时期。一般来讲,金融计量分析中所使用的数据大多数为时间序列数据和横截面数据。
金融数据与经济数据相比,主要体现在频率、准确性、周期性等方面所具有的特有性质。一般宏观经济数据都是季度、年度数据,频率较低,这有时会导致“小样本问题”(即数据缺乏),从而给计量分析带来困难。而金融数据则不然,在金融市场上可以得到月、日,甚至每分钟的金融数据,用于计量分析的数据可以达到成千上万。宏观经济数据通常是测算和估计出来的,不可避免会带有一定差错,而金融数据都是在金融交易发生时准确记录下的,因而存在差错的可能性要比宏观经济数据小得多。金融数据序列与宏观经济数据序列一样,一般也是非平稳的,但金融数据序列一般难以区分随机游走、趋势以及其他的一些特征。
二、金融数据的处理
(一)数据处理方法金融时间序列数据,既有季节因素问题,又存在序列平稳性问题。金融指标的月度或季度时间序列包含4种变动要素:长期趋势要素T、循环要素C、季节变动要素S和不规则要素I。因而在进行分析时,季节变动要素和不规则要素往往掩盖了经济金融发展中的客观变化,给研究和分析经济发展趋势和判断目前经济所处的状态带来困难。因此,需要在经济分析之前将经济时间序列进行季节调整,剔除其中的季节变动要素和不规则要素,利用趋势分解方法可将趋势和循环要素分离开。对某些金融时间序列(如股票序列),不存在明显的趋势变动和季节变动,通常使用指数平滑方法对其进行拟合及预测。
实践中,比较常用的数据处理方法主要有:一是移动平均法。其实就是算术平均法,能对周期(及其整数倍)与移动平均项数项相等的周期性变动基本得到消除,互相独立的不规则变动得到平滑。一般分为简单移动平均公式、中心化移动平均、加权移动平均。二是季节调整(seasonaladjustment),就是从时间序列中剔除季节变动要素,从而揭示出序列潜在的趋势循环分量,趋势循环分量能够真实地反应经济时间序列的客观规律。
只有季度、月度数据才能做季节调整。目前有4种比较常用的季节调整方法,如CensusX12,X11、移动平均方法和Tramo1Sears方法(已有现成的软件可以计算)。三是趋势分解。测定长期趋势有多种方法,比较常用的方法有回归分析方法、移动平均法、阶段平均法(phase一average,PA法)、HP(Hodrick一Prescott)滤波方法和频谱滤波方法(band一pass,BP滤波)。四是指数平滑方法,对单指标时间序列数据,一般采用指数平滑方法进行拟合及预测。比较常用的方法有:单指数平滑,双指数平滑,Holt一Winter。乘法(加法)模型,Holt一Winters一无季节性模型等。
(二)数据序列平穗性检验一个金融数据序列的平稳性能够严重地影响到它的行为和性质;运用非平稳数据计量分析会导致谬误回归(spuriousregressions)。如果两个非平稳变量是由独立的随机序列而产生,当用其中一个变量对另一个变量进行回归时,斜率系数的t估计显着为零,并且RZ值将非常低。对于互不相关的变童,这似乎是显而易见的。但是,如果两个变量存在随时间变化的趋势,即使不相关,其中一个变量对另一个变量的回归也会产生较高的RZ值,所以,如果把标准的回归技术应用到非平稳数据中,得到的最终结果是在标准测定下,回归“看起来”很好,系数估计显着,Rz值也很高,但事实上,它是毫无价值的,这样的模型成为“谬误回归”。如果回归模型中使用的变量是非平稳的,那么还可以证明用于渐近分析的标准假定将不再有效。换言之,常用的“t比率”不再遵循t分布,统计量不再遵循F分布等等。
平稳序列就是指序列在不同时刻会保持稳定。更具体一点,是指一个序列的均值和协方差与时间无关。金融市场上的大多数数据为非平稳数据。如股票指数,汇率、通货膨胀率。同时,在金融研究的各种方法中,如线性回归、ARMA,Granger因果检验,都要求相应的数据序列是平稳的。检验序列平稳性的标准方法是单位根检验。如Dickey一Fuller(DF)检验,AugmentedDickey一Fullertest(ADF)检验,Phillips一Perron(PP)检验,KPSS检验(Kwiatkowski,Phillips,Schmidt,andShinTest)、ERS检验(Elliot,Rothenberg,andStockPointOptimalTest)和NP检验(NgandPerronTests),前三种方法出现的比较早,在实际应用中较为常见,但是,由于这3种方法均需要对被检验序列作可能包含常数项和趋势变量的假设,因此,应用起来带有一定的不方便;后三种方法克服了前3种方法带来的不便,在剔除原序列趋势的基础上,构造统计量检验序列是否存在单位根,应用起来相对方便。