波动性的高频指标对收益分布预测能力的影响分析— ——基于上证综指的高频数据
— ——基于上证综指的高频数据4
朱万锐,唐大为100081) (中央财经大学中国金融发展研究院,北京
VAR [摘要]当今许多金融问题,例如计算、期权定价等,都需要首先对收益率的分布特征有比较准确的描述。之前realizedvolatility, RV)———的研究发现衡量波动性的高频指标— ——已实现波动 ( 可以帮助我们更好地预测收益率分布。文章探究这个结论是否适用于中国市场。[关键词]高频指标;市场;收益分布;预测能力DOI 10 13939/ j cnki zgsc 2017 18 063 [ ] 1 引 言
HAR) Corsi, 2009;我们 将 异 质 自 回 归 ( 模型 ( Andersenetal ,2007) EGARCH与基准模型 进行比较,比较的方法是“预测似然度”。预测似然度是根据已实现收益率预测得出的概率密度,是一种衡量数据与模型吻合程度的指标。模型的预测能力越好,它的预测似然度就会越大。平RV均预测似然度的期限结构能够显示 在长短不同的预测步数中有多大的作用。
2 数 据
2008 1 1 2015 12 31本文选取 年 月 日至 年 月 日期间上证综5 9∶ 30指分钟交易数据作为研究对象。中国股市的开盘时间为- 11∶ 30 13∶ 00- 15∶ 00, 48 5和 所以每个交易日会有 个 分钟5 5交易数据。对于每个分钟交易数据,我们计算一个 分钟连100 i= 1,续复利对数收益率,并乘以 进行标准化,记为 i ( I), I t 5 I …, 其中 为第 天里分钟收益率的个数。在中国, 通48, 1945常等于但由于会存在一些交易日提前闭市,所以 个交93360 5 ,2008— 2012易日中一共产生了 个分钟收益率。其中2013— 2015年的数据用于模型估计, 年的数据用于预测,故样1218 727本内包含 个交易日,样本外包含 个。
3 RV定义
RV定义为一段时间内收益率的平方和,在股价连续且Merton,没有测量错误时,是波动性的一种无偏估计量 ( 1980) RV。未经调整的日 估计量如下计算: RVT, u= r2 1) t, i ( RV随着日内收益率频率的上升, 会存在偏误问题— —— Fang, 1996; Andreouandghysels, 2002;即市场微观噪音 ( Oomen, 2002; Bai Russellandtiao, 2004)、 。为了消除有偏Hansenandlunde( 2006)性和不一致性,我们采用 所建议Bartle RV RV的 权重对 进行调整,经调整的 如下计算: j q It- j RVT, ACQ= r2 i+ 2 1- q+ 1) irt,t, [ ( ( i+ j) ],其j= 1 i= 1 q= 1,2,3 2)中, ( 为了跟波动性指标相匹配,日收益率应该使用每天收盘价100和开盘价之间的对数差,同样乘以 来标准化。我们将日收RV益率的方差设为基准,不同的均值与其均值做比较,选择RV HAR- RV最接近的 用于 模型。经过统计性分析,日收益2 761572; q= 0,1,2,3 RV率的方差为 当 时, 的均值分别为2 151439 2 114523 20197238 2 162044、 、 、 。可以看出,未经调RV q= 2 RV2整的确实存在很大的偏误。当 时, 的均值与日收HAR- RV RV2益率的方差最接近,所以, 模型采用 。 GARCH GARCH我们 在 族中 考 虑 了 三 种 模 型: 、EGARCH TGARCH EGARCH和 。经回归 模型的最大似然度EGARCH 1,1)最大,因此选择 ( 作为基准模型。
5 HAR- RV模型
Corsi( 2009)提出了一个新模型— ——已实现波动的异HAR- RV)质自回归模型 ( 。在这个模型中我们可以加入日内数据,模型设定如下: = σtεt, εt~ NID( 0,1) ln( RVT) = ω+ 1ln( RVT- + 2ln( RVT- + 3ln 1) 5,5) RVT- 22,22) + υt 3) ( ( 5 1收益率过程HAR- RV在标准 模型中,高频收益率过程只由日波动σ(珘 σ(珘 = σ( σ( d) d) d) d)率 t决定。模型假设 t t ,其中 t是日波动率。收益率过程如下所示: = σ( εt, εt~ NID( 0,1) d) t