资源描述
敬请参阅最后一页特别声明 -1- 证券研究报告 2017 年 11 月 23 日 金融工程 高频因子 : 日内分时成交量蕴藏玄机 多因子系列报告之 八金融工程 深度 多因子系列报告 之五中 ,我们已对集合竞价阶段的成交量占比做了详尽的解析,集合竞价成交量占比因子也具有突出的选股效果 。 本篇报告将分时研究成交量占比,继续挖掘日内高频数据中的有效选股因子。 股票分时成交量呈现周期性日内模式 。 国外股票市场的日内成交量普遍呈“ U”型周期变化,即成交量在开盘和收盘阶段比其他交易时段更高,我国股市因存在午间休市,因此在下午开盘时成交量一般会存在一个小高峰,构成一个“ W ”型。对股票日内的成交量分时研究, W 的三个峰值前后时点的成交量值得重点关注 。 不同时段 成交量占比因子有效性差异明显 。 以 5 分钟为划分频率,分时研究日内 49 个时段的成交量占比因子, 在上午 10:00 之前和 14:50 之后,成交量占比因子与股票次 月收益呈较强的负相关性;而在 10:10 至 14:50 之间 则 呈现较强的正相关性。结合上午、下午开盘后成交量占比因子的预测方向 和效果 ,以 早 盘的前 30 分钟成交量作为 分子(含集合竞价阶段),午盘的前 30 分钟成交量作为分母构造成交量比值因子 VR。 移动平均窗宽越小, VR因子预测能力 越显著 。 同样采用简单移动平均 (MA)和指数加权平均方式构造低频选股因子, 两种加权方式构造的低频选股因子 IC 均值绝对值均高于 6%, IR 绝对值均大于 0.5,显示出了 VR 因子整体良好的预测性和稳定的预测能力。 不同加权方式对比 ,简单平均 VR 更胜一筹 。 从因子选股组合的年化收益率、累积收益率、年化波动率、夏普比率和最大回撤五个维度对比,月度算术平均 VR 因子回测效果佳,年化收益率可达 15.5%,夏普比率为0.95,最大回撤为 31.9%。同时发现 移动平均窗宽越大 ,因子选股换手率越低 ,对费用的变化越不敏感 。 中性化后的成交量比值 VR 因 子仍有预测 能力 。 经过 波动、市值、流动性 、行业中性化后的 成交量比值 VR 因子 有效性指标有所减弱,但仍旧具备一定的选股能力和预测性 。 IC 均值为 -2.13%, IR 绝对值达 0.42,多空组合年化收益为 3.01%,夏普比率达 0.83。 风险提示: 测试结果均基于模型 和历史数据 ,模型存在失效的风险 。分析师 刘均伟 (执业证书编号: S0930517040001) 021-22169151 liujunweiebscn 联系人 古翔 021-22169325 guxiangebscn 相关研究 因子测试框架 多因子系列报告之一 因子测试全集 多因子系列报告之二 多因子组合“光大 Alpha 1.0” 多因子系列报告之三 别开生面:公司治理因子详解 多因子系列报告之 四 见微知著:成交量占比高频因子解析 多因子系列报告之 五 行为金融因子:噪音交易者行为偏差 多因子系列报告之六 基于 K 线最短路径构造的非流动性因子 多因子系列报告之七 2017-11-23 金融工程 敬请参阅最后一页特别声明 -2- 证券研究报告 目 录 1、 成交量日内模式探索 . 5 1.1、 关注度高的尾盘 30 分钟 . 5 1.2、 日内分钟成交量呈周期性 “W”型 . 5 1.3、 5 分钟成交量占比因子预测性显著 . 6 2、 日内成交量占比因子的构建 . 8 2.1、 开盘 30 分钟成交量比值因子构造 . 8 2.2、 因子特征分析 . 10 3、 VR 因子具有较显著预测能力 . 11 3.1、 加权方式对 VR 因子有效性影响小 . 11 3.2、 月度平均 VR 因子表现突出 . 12 3.3、 VR 因子单调性较好,分层效应尚可 . 14 3.4、 剔除相关因子后仍具备选股能力 . 16 3.5、 冲击成本较高时, 60 日移动平均 VR 因子更优 . 18 风险提示 . 20 2017-11-23 金融工程 敬请参阅最后一页特别声明 -3- 证券研究报告 图 目录 图 1:某股票尾盘放量拉升的日内价格走势图 . 5 图 2:上证综指日内分钟成交量呈周期性明显的 “ W ”型 . 6 图 3:日内不同时点月度平均 vcpt 因子 IC 均值 . 7 图 4:日内不同时点月度平均 vcpt 因子 IR 值 . 7 图 5:噪音交易者早盘交易潮成因 . 8 图 6:上午 &下午成交量比值因子构造 . 9 图 7: VR 原始因子呈 “尖峰、厚尾 ”分布 . 10 图 8:极值处理 &截面标准化后的 VR 因子分布 . 10 图 9: VR 因子不同市值中位数与平均数 . 10 图 10: VR 因子的行业分布中位数差异细微 . 11 图 11: VR 因子不同参数下 IC 均值相对稳定 . 12 图 12: VR 因子不同参数下 IR 值随着移动平均天数增加而降低 . 12 图 13: VR 因子不同参数下组合的年化收益率对比 . 14 图 14: VR 因子的 Rank IC 序列呈现显著的负相关性 . 15 图 15:月度算术平均 VR 因子具有良好的单调性 . 16 图 16: VR 因子与其他大类因子历史 IC 值相关性检验 . 17 图 17:中性化后的 VR 因子 Rank IC 均值降低 . 17 图 18:中性化后的 VR 因子单调性下降 . 18 图 19:不同费率下月度算术平均 VR 因子选股组合与中证 500 净值走势 . 18 图 20: VR 因子选股组合相对中证 500 净值走势 . 19 图 21:不同参数 VR 因子选股换手率随回溯天数增加而降低 . 20 图 22:月度平均与 60 日移动平均 VR 因子选股收益率对比 . 20 2017-11-23 金融工程 敬请参阅最后一页特别声明 -4- 证券研究报告 表 目录 表 1:上午 &下午开盘前 30 分钟分时段成交量占比指标测试结果 . 8 表 2:不同窗宽的算术平均移动平均下, VR 因子的有效性测试指标对比 . 11 表 3:不同窗宽的指数加权移动平均下, VR 因子的有效性测试指标对比 . 12 表 4:因子选股策略回测框架 . 13 表 5:月度算术平均 VR 因子回测效果较好 . 13 表 6: 25 日指数加权平均 VR 因子回测效果较好 . 14 表 7:因子分组回测框架 . 15 表 8:月度算术平均 VR 因子分层回溯测试 . 16 表 9: 不同费率下 VR 因子 (d=m, w=1)选股组合回测指标 . 18 表 10: VR 因子选股组合分年度回测指标(基准: 中证 500) . 19 2017-11-23 金融工程 敬请参阅最后一页特别声明 -5- 证券研究报告 1、 成交量日内模式 探索 1.1、关注度高的尾盘 30 分钟 近来, 众多投资者关注尾盘 30 分钟的股票表现,他们认为,这一时段的高成交量是源于大量知情交易者的交易。因此,这段时间是市场信息充分反映的重要阶段,这部分成交量的高低是用以选股重要指标。 受此启发,我们计划探索股票成交量的日内模式,并利用日内分时成交量构建有效选股因子。 图 1:某股票尾盘放量拉升的日内价格走势图 资料来源: Wind,光大证券研究所 1.2、日内分钟成交量呈周期性“ W”型 股票分时成交量呈现 周期性 日内模式。国内外已有研究表明,金融市场微观结构特征变量的日内数据蕴含着丰富的动态特征。成交量的变动可作为市场流动性、市场多空情绪强度及投资者信息流动等的代理变量,在市场微观结构中发挥着重要作用。 国外股票市场的日内成交量普遍呈“ U”型周期变化,即成交量在开盘和 收盘阶段比其他交易时段更高,我国股市因存在午间休市,因此在下午开盘时成交量一般会存在一个小高峰 ,构成一个 “ W ”型 。对股票日内的成交量分时研究, W 的三个峰值前后时点的成交量必然是应该重点关注的。 多因子系列报告之五中,我们已对集合竞价阶段的成交量占比做了详尽的解析,集合竞价成交量占比因子具有突出的选股效果。我们将沿用集合竞价成交量占比因子的测试方法,对日内每分钟的连续竞价阶段成交量占比因子的选股效果进行测试。 2017-11-23 金融工程 敬请参阅最后一页特别声明 -6- 证券研究报告 图 2: 上证综指 日内分钟成交量呈 周期性明显的“ W ”型 资料来源: Wind,光大证券研究所 ,注: 2017.11.1-2017.11.15 1.3、5 分钟成交量占比因子预测性显著 对于因子数据的清洗和有效性检验在此前的多因子系列报告中已有详细阐述,这里仅作简单回顾。 绝对中位数法去极值 : 在因子测试阶段 ,由于因子本身的分布是否为正态分布无法确定, 我们采用稳健的 MAD(绝对中位数法)去除极值更加合适。 截面 标准化处理 :通过横截面 z-score 方法,以每个时间截面 t 上的所有股票的为样本,分别计算其均值和标准差得到如下所示 stand(factor)。此标准化方式属于因子的线性变换,并不会改变原始因子的分布特征。 stand() = () 有效性及稳定性检验 : 采用多期截面 RLM 回归后我们可以得到因子收益序列 ,以及每一期回归假设检验 T 检验的 t 统计量 序列,针对这两个序列我们通过以下几个指标来判断该因子的有效性 和 稳定性:( 1) 因子收益序列 的假设检验 t 统计量值( 2) 因子收益序列 大于 0 的概率( 3) t 统计量绝对值的均值( 4) t 统计量绝对值大于等于 2 的概率 有效性及预测能力检验 :我们计算行业中性与市值中性处理后的 RankIC(因子值与股票次月收益率的秩相关系数),通过以下几个与 IC 值相关的指标来判断因子的有效性和预测能力:( 1) IC 值的均值( 2) IC 值的标准差2017-11-23 金融工程 敬请参阅最后一页特别声明 -7- 证券研究报告 ( 3) IC 大于 0 的比例 ( 4) IC 绝对值大于 0.02 的比例 ( 5) IR( IR = IC 均值 /IC 标准差) A 股市场日内交易时长总计 4 小时,以 5 分钟为间隔可划分为 48 个时间区间,纳入集合竞价阶段总计 49 个时间区间。每日每个时点 成交量占比因子计算方式: = 其中 :表示每日个股 t-1 至 t 时刻 5 分钟内的成交量 :表示日内个股总成交量 不同时点成交量占比因子有效性差异明显。以股票月度平均 vpct 因子为例,对各个时点的因子做有效性测试,因子对股票未来收益的预测性在早晨10:00 和下午 14:50 均出现反转情形。在上午 10:00 之前和 14:50 之后,成交量占比因子与股票下月收益呈较强的负相关性;而在 10:10 至 14:50 之间成交量占比因子与股票次月收益呈现较强的正相关性。 根据日内不同时段的成交量占比因子表现可以发现: 尾盘 30 分钟的成交量并不具有显著的预测能力 ,但上午开盘时的成交量占比因子 与下期收益具有显著的负相关关系;下午开盘时的成交量占比因子与下期收益具有显著正相关关系 ,这两点均值得关注。 图 3:日内不同时点月度平均 vcpt 因子 IC 均值 图 4:日内不同时点月度平均 vcpt 因子 IR 值 资料来源: 光大证券研究所 , 注: 2010.01.01-2017.06.30 资料来源:光大证券研究所 , 注: 2010.01.01-2017.06.30 根据传统的金融理论, 上午 开盘后交易量的放大可以理解为是对收盘期间新的信息的集中反映。但上午开盘与下午开盘不同的是,在我国“ T+1” 的证券交易制度下,上午开盘意味着当日新的交易机会的释放,而此时正是噪音交易者最容易 释放情绪的时段 ,也许早上开盘时成交量占比因子具有显著的反转效应,正因为捕捉到了噪音交易者的交易潮。相较之下, 理性交易者一般会相对均匀的分布在日内的各个时点 进行 交易 。 2017-11-23 金融工程 敬请参阅最后一页特别声明 -8- 证券研究报告 图 5: 噪音交易者早盘 交易潮 成因 资料来源: 光大证券研究所 2、 日内 成交量占比因子 的构建 虽然尾盘半小时成交量不具有显著的预测能力,但上午开盘与下午开盘时段的成交量占比因子依然值得关注,后面我们将依据这一规律构造有效选股因子。 2.1、开盘 30 分钟成交量比值因子构造 基础指标:日内上下午成交量比值 VR( Volume Ratio)分时研究,开盘 30 分钟 成交量因子 优势互补。 从成交量占比因子分时研究的结果来看,上午和下午开盘 30 分钟的 成交量 因子 的 预测性显著且 预测方向相反 。如何组合 上午、下午的成交量占比因子以充分发挥每个因子的长处,以获得更有效的低频选股因子,下面我们将详细阐述。 表 1: 上午 &下午开盘前 30 分钟分时段成交量占比指标测试结果 日内交易 时间 区间 因子收益 均值 因子收益 t 值均值 t 值 0 比例 因子收益 均值绝对值 IC 均值 IC 标准差 IC0 比例 abs(IC) 0.02 比例 IR 9:30 -2.00% -2.96 16.7% 2.55% -6.12% 0.093 22.2% 16.7% -0.66 9:35 -1.06% -3.60 15.6% 1.42% -7.12% 0.103 17.8% 14.4% -0.69 9:40 -0.72% -3.04 20.0% 0.99% -6.21% 0.100 25.6% 16.7% -0.62 9:45 -0.54% -2.57 22.2% 0.77% -5.58% 0.092 27.8% 24.4% -0.61 9:50 -0.34% -1.64 28.9% 0.62% -3.86% 0.080 30.0% 24.4% -0.48 9:55 -0.19% -1.13 30.0% 0.50% -2.72% 0.069 33.3% 25.6% -0.39 10:00 -0.12% -0.70 36.7% 0.40% -1.70% 0.064 42.2% 26.7% -0.27 13:05 0.35% 1.66 68.9% 0.57% 4.11% 0.081 66.7% 58.9% 0.51 13:10 0.29% 1.42 65.6% 0.49% 3.19% 0.062 65.6% 54.4% 0.51 13:15 0.22% 1.16 65.6% 0.37% 2.57% 0.051 70.0% 51.1% 0.51 13:20 0.23% 1.13 68.9% 0.36% 2.54% 0.046 73.3% 47.8% 0.55 13:25 0.24% 1.22 74.4% 0.38% 2.57% 0.046 73.3% 51.1% 0.56 13:30 0.24% 1.25 74.4% 0.36% 2.75% 0.048 76.7% 60.0% 0.57 资料来源: Wind, 光大证券研究所 2017-11-23 金融工程 敬请参阅最后一页特别声明 -9- 证券研究报告 以日内分时成交量占比为切入点,结合上午、下午开盘后成交量占比因子的预测方向, 以 上午开盘的前 30 分钟成交量作为 分子(含集合竞价阶段),下午开盘的前 30 分钟成交量作为分母构造成交量比值因子 ,简记为 VR( Volume Ratio)。根据成交量占比分时研究结果,上午开盘 30分钟的成交量越小或者下午开盘 30 分钟的成交量越大 ,则成交量比值因子的值越小,对于股票次月收益预测的有效性 将 更强。 同样也印证了噪音交易行为越不活跃的股票,次月 股价 上扬趋势 概率较大。 图 6: 上午 &下午 成交量比值因子构造 资料来源:光大证券研究所 选股因子的低频化处理继续秉承高频数据,低频信号的构造原理,以每日上下午成交量占比 VR为基础指标,采用与集合竞价成交量占比因子同样的 变频方式简单移动平均( MA)和指数加权移动平均( EMA) 分别构造选股因子,通过对比不同参数下选股因子的有效性 测试指标果 和 选股 回测 效果 ,获得最优的成交量比值选股因子。 = 1 ( )=1其中 : 每日上午、下午开盘的前 30 分钟成交量比值; = (1)i1 (1)i1i=1 ,指数加权1,算术平均为时间权重因子; :信息的衰减强度, = 21+; d: 每月最后一个交易日向前回溯移动平均的交易日个数。 因子计算过程的特殊值处理:每日成交量比值的计算过程涉及到除法运算,若出现分母为零的情形则用空值代替;时间轴上,个股存在停牌情形,对于 d 个交易日的移动平均限定至少有 5 个交易日为非 空 值 。2017-11-23 金融工程 敬请参阅最后一页特别声明 -10- 证券研究报告 2.2、因子特征分析 VR 因子呈“尖峰、厚尾”。我 们以 月度平均的 VR 因子为例, 可以观察到原始的 VR 因子呈现 明显的 “右偏、尖峰、厚尾”分布特征 ,因此在数据清洗阶段对因子进行截面标准化并用 MAD 法对极端值进行处理,降低离群点对计算因子收益的影响。 图 7: VR 原始因子呈“尖峰、厚尾”分布 图 8: 极值处理 &截面标准化后的 VR 因子分布 资料来源: 光大证券研究所 ,注: 2017 年 6 月的因子数据为例 资料来源:光大证券研究所 , 注: 2017 年 6 月的因子数据为例 VR 因子中位数市值差异细微 。为了排除股票市值等外部因素的影响,需要考察因子在不同市值的分布情况。分别以沪深 300 成分股、中证 500 成分股中市值最小的作为大市值、中市值和小市值的分界点, VR 因子的中位数与平均数差异较大;从因子的平均数看,股票市值越小对应的因子值越大;平均数易受极端值的影响,从更稳健的因子的中位数看,不同市值的股票间因子值差异细微。 图 9: VR 因子不同市值中位数与平均数 资料来源: Wind,光大证券研究所 2017-11-23 金融工程 敬请参阅最后一页特别声明 -11- 证券研究报告 不同行业间 VR 因子暴露中位数差异较小。将所有股票按照中信一级行业划分,有色金属行业的 VR 因子中位数最大,电子元器件行业的因子中位数最小,所有 29 个行业的因子暴露中位数均处于 1.00 和 1.25 之间,相互之间的差异较不显著。 图 10: VR 因子的行业分布中位数 差异细微 资料来源: Wind,光大证券研究所,注:使用中信一级行业 3、 VR 因子 具有 较 显著预测能力 3.1、加权方式对 VR 因子有效性影响小 VR 因子总体具有较强的显著性和预测能力。 选定向前移动平均的天数为 5至 60 天, 因子有效性指标测试结果如下表所示, 两种加权方式构造的低频选股因子 IC 均值绝对值均高于 6%, IR 绝对值均大于 0.5,显示出了 VR 因子整体 良好的预测性和稳定的预测能力。 表 2: 不同窗宽的 算术平均移动平均下, VR 因子的有效性测试指标对比 向前移动平均交易日个数 因子收益 均值 因子收益 t 值均值 t 值 0 比例 因子收益 均值绝对值 IC 均值 IC 标准差 IC0 比例 abs(IC) 0.02 比例 IR d_5 -2.88% -3.14 18.9% 3.63% -6.25% 0.072 17.8% 11.1% -0.86 d_10 -3.24% -3.38 20.0% 4.02% -7.19% 0.085 18.9% 11.1% -0.85 d_15 -3.70% -3.45 20.0% 4.71% -7.61% 0.093 22.2% 16.7% -0.82 d_m -3.44% -3.32 21.1% 4.72% -7.10% 0.094 22.2% 18.9% -0.75 d_20 -3.42% -3.34 21.1% 4.65% -7.19% 0.093 21.1% 16.7% -0.77 d_25 -3.21% -3.26 24.4% 4.68% -6.97% 0.099 24.4% 15.6% -0.71 d_30 -3.14% -3.22 23.3% 4.70% -6.92% 0.102 23.3% 20.0% -0.68 d_35 -3.42% -3.09 24.4% 5.17% -6.71% 0.105 24.4% 20.0% -0.64 d_40 -2.90% -2.98 25.6% 5.33% -6.46% 0.107 26.7% 20.0% -0.60 d_45 -2.69% -2.96 26.7% 5.48% -6.49% 0.110 26.7% 21.1% -0.59 d_50 -2.53% -2.87 28.9% 5.44% -6.40% 0.112 26.7% 22.2% -0.57 d_55 -2.50% -2.80 31.1% 5.46% -6.30% 0.113 30.0% 22.2% -0.56 d_60 -1.73% -2.75 32.2% 6.12% -6.15% 0.115 31.1% 23.3% -0.54 资料来源: Wind, 光大证券研究所 2017-11-23 金融工程 敬请参阅最后一页特别声明 -12- 证券研究报告 表 3:不同窗宽的 指数加权移动平均下, VR 因子的有效性测试指标对比 向前 移动平均交易日 个数 因子收益 均值 因子收益 t 值均值 t 值 0 比例 因子收益 均值绝对值 IC 均值 IC 标准差 IC0 比例 abs(IC) 0.02 比例 IR d_5 -2.22% -3.39 15.6% 2.96% -6.85% 0.077 21.1% 8.9% -0.89 d_10 -2.45% -3.73 18.9% 3.09% -7.53% 0.087 21.1% 14.4% -0.87 d_15 -2.43% -3.81 18.9% 3.14% -7.66% 0.094 18.9% 16.7% -0.81 d_m -2.20% -3.41 18.9% 2.95% -6.84% 0.094 24.4% 21.1% -0.72 d_20 -2.25% -3.80 20.0% 3.28% -7.62% 0.100 21.1% 18.9% -0.76 d_25 -2.05% -3.76 22.2% 3.54% -7.53% 0.105 22.2% 20.0% -0.72 d_30 -1.89% -3.72 22.2% 3.76% -7.42% 0.108 22.2% 20.0% -0.69 d_35 -1.79% -3.68 22.2% 3.92% -7.30% 0.111 23.3% 21.1% -0.66 d_40 -1.74% -3.62 23.3% 4.03% -7.18% 0.113 24.4% 20.0% -0.63 d_45 -1.69% -3.57 24.4% 4.15% -7.06% 0.115 26.7% 21.1% -0.61 d_50 -1.67% -3.51 25.6% 4.28% -6.94% 0.117 27.8% 21.1% -0.59 d_55 -1.67% -3.46 25.6% 4.39% -6.82% 0.119 27.8% 21.1% -0.57 d_60 -1.68% -3.41 25.6% 4.5
展开阅读全文