资源描述
敬请参阅最后一页特别声明 -1- 证券研究报告 2017 年 9 月 1 日 金融工程 见微知著: 成交量占比 高频因子 解析 多因子系列报告之 五 金融工程 深度 随着定价模型的深入研究,因 子的覆盖范围也不断拓宽。技术引领金融数据不断创新,市场的有效性 逐渐增强,承载着更多信息的高频数据因子应运而生。在金融市场中,由于交易的连续性,信息对股票价格的影响是连续的,数据采集的频率越高, 更能 全面真实 地 刻画市场 微观结构 。 本文从 市场微观结构出发 ,构造了 有别于低频因子的有效选股因子 集合竞价成交量占比 。 集合竞价阶段是反映投资者行为信息的重要时点 。 我国股票的日内交易分为集合竞价阶段和连续竞价阶段,累计交易时长 4 小时 。开盘和收盘是一天中股市交易的最重要的阶段,开盘集合竞价阶段是隔夜信息释放的第一时点,而收盘集合竞价阶段则是日内交易信息反映的最后时点。 集合竞价阶段遵从价格优先、时间优先的原则,投资者根据股票前日收盘价及其对当日股价的心理预期输入申报价格。一般而言,集合竞价阶段成交量反映了多空双方对个股开盘价格的认同度 。 价走量先行, 集合竞价 成交量占比 因子选股能力 突出 。 集合竞价阶段的交易数据是日内高频数据的特有部分,我们以成交量为切入点,以相对指标 个股 集合竞价成交量占比为日内高频指标,采用技术分析中最常用指标构造方式 简单移动平均( MA)构造开盘集合竞价成交量占比因子OCVP。 同时考虑信息的时间衰减效用,引入具有时变效用的权重修正OCVP 因子 。经过检验 OCVP 因子具备良好的预测能力和单调性, 其 IC均值为 -5.6%, IR 绝对值为 0.83。 叠加尾盘效应 的 复合因子 选股能力显著提升 。 考虑到收盘前阶段为日内信息传递到当日交易的最后时点,我们 纳入收盘前 5 分钟成交量占比因子,通过加权方式构造复合因子 OBCVP。最优权重组合下,复合因子的 预测性 和单调性显著提升, IC 均值为 -7%, IR 绝对值大于 1。 根据因子值将股票等分 5 组的多空对冲组合 8 年 年化收益为 15.10%, 夏普 比率达3.03,最大回撤为 10.2%。 中性化后的集合竞价成交量因子仍有选股能力 。 经过 VSTD、市值、动量、行业中性化后的 成交量占比复合因子 OBCVP 依旧表现出了不俗的预测能力和选股能力 。 IC 平均值为 -3.7%, IR 绝对值达 0.79。 证明集合竞价成交量占比一定程度上可以反应 市场对于股票的关注程度和投资者观点的 一致 程度 ,因而该因子具有其独有的选股能力 。 风险提示: 测试结果均基于模型 和历史数据 ,模型存在失效的风险 。 分析师 刘均伟 (执业证书编号: S0930517040001) 021-22169151 liujunweiebscn 联系人 周萧潇 021-22167060 zhouxiaoxiaoebscn 相关研究 因子测试框架 多因子系列报告之一 因子测试全集 多因子系列报告之二 多因子组合“光大 Alpha 1.0” 多因子系列报告之三 别开生面:公司治理因子详解 多因子系列报告之 四 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -2- 证券研究报告 目 录 1、 高频数据中探寻选股因子 . 5 1.1、 高频数据窥见市场微观结构 . 5 1.2、 日内交易重要时段:集合竞价阶段 . 5 2、 成交量占比高频因子构造 . 6 2.1、 因子具体构造方式 . 6 3、 OCVP 因子具备较理想的选股能力 . 7 3.1、 因子特征分析 . 7 3.2、 OCVP 因子有效性优于 BCVP . 8 3.2.1、 因子数据清洗与标准化 . 9 3.2.2、 因子有效性检验 . 10 3.3、 成交量占比因子最优参数选择 . 11 3.3.1、 回测框架建立 . 11 3.3.2、 10日简单移动平均 OCVP表现突出 . 12 3.3.3、 一个自然月简单移动平均 BCVP表现较好 . 13 4、 日内交易首尾因子效应叠加 . 15 4.1、 复合因子 OBCVP 选股能力显著提升 . 15 4.1.1、 成交量占比复合因子构建 . 15 4.1.2、 寻找复合因子最优权重配比 . 16 4.2、 OBCVP 因子选股组合收益可观 . 18 5、 剔除相关因子后依然具备选股能力 . 19 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -3- 证券研究报告 图 目录 图 1: 2017 年 7 月上证综指的日线与 15 分钟线走势对比 . 5 图 2:中国股市不同阶段交易制度示意图 . 6 图 3: OCVP 因子的分布( 2017 年 6 月的因子数据为例) . 8 图 4: OCVP 因子与股票次月收益率呈现一定负相关性 . 8 图 5: OCVP 因子不同市值中位数与平均数 . 8 图 7: OCVP 因子 Rank IC 序列 . 10 图 8: OCVP 因子单调性显著 . 10 图 9: BCVP 因子 Rank IC 序列 . 11 图 10: BCVP 因子单调性尚可 . 11 图 11: OCVP 因子不同参数下组合的年化收益率对比 . 13 图 12: BCVP 因子不同参数下组合的年化收益率对比 . 14 图 13: OCVP(d=10,TW=0)因和 BCVP(d=m,TW=0)因子回测净值走势 . 15 图 14: OCVP 因子与 BCVP 因子效应叠加示意图 . 15 图 15: OCVP 因子与 BCVP 因子不同参数下回溯年化收益率 . 16 图 16:复合因子中 OCVP 的权重在 0.85, 0.93时组合年化收益达峰值 . 16 图 17: OCVP 因子、 BCVP 因子及复合因子 OBCVP 分布 . 17 图 18: OBCVP 因子 Rank IC 序列 . 17 图 19: OBCVP 因子具备良好的单调性 . 17 图 20:不同费率下 OBCVP 因子选股组合与中证 500 净值走势 . 18 图 21: OBCVP 因子选股组合相对中证 500 净值走势 . 19 图 22: OBCVP 与其他大类因子历史 IC 值相关性检验 . 20 图 23:中性化后的 OBCVP 因子 Rank IC 序列 . 20 图 24:中性化后的 OBCVP 因子单调性良好 . 20 图 25:中性化前后 OBCVP 选股组合分年度收益率对比 . 21 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -4- 证券研究报告 表 目录 表 1:因子分组回测框架 . 9 表 2: OCVP 与 BCVP 因子有效性测试结果对比 . 10 表 3:因子选股策略回测框架 . 11 表 4:因子参数测试: 10 日移动平均 OCVP 因子表现突出 . 12 表 5:因子参数测试: 5 日指数加权移动平均 TWOCVP 因子表现突出 . 12 表 6:因子参数测试:一个自然月简单移动平均 BCVP 因子表现突出 . 13 表 7:因子参数测试: 5 日指数加权移动平均 TWBCVP 因子表现突出 . 14 表 8: OBCVP 因子的有效性测试结果 . 17 表 9:不同费率下 OBCVP 因子选股组合回测指标 . 18 表 10: OBCVP 因子选股组合分年度回测指标(基准 :中证 500) . 19 表 11:中性化后的 OBCVP 因子选股组合分年度回测指标(基准 :中证 500) . 21 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -5- 证券研究报告 1、 高频数据中探寻 选股因子 1.1、 高频数据 窥见 市场微观结构 高频数据承载更 丰富的 市场信息 。 随着定价模型的 深入研究 ,因子 的覆盖范围也不断拓宽。技术引领金融数 据不断创新,市场的有效性也逐渐增强,承载着更多信息的高频 因子 应运而生。 在金融市场中 ,由于交易的连续性,信息对股票价格的影响是连续的, 数据采集的频率越高 , 其蕴含的信息量越 丰富 , 则 能 更加 全面真实的 刻画 市场 微观结构 。 以 2017 年 7 月上证综指的走势为例, 同时期的日线与 15 分钟线整体走势一致, 而细观价格与成交量的波动,则 15 分钟线更能反映交易者 日内 行为信息。 图 1: 2017 年 7 月上证综指 的 日线与 15 分钟线走势对比 资料来源: Wind,光大证券研究所 一般而言的金融高频数据 指日内交易数据, 分为 以下 两类 : ( 1)高频数据 :以小时、分钟甚至秒为采样频率的成交量、成交额、最高价、最低价、开盘价和收盘价等;( 2)超高频数据 :交易过程的分笔成交数据。 本篇报告 主要 基于市场微观结构理论: 尝试 从 高频数据中 过滤有价值的信息,从而斩获有别于低频数据的有效 选股 因子 集合竞价成交量占比 。 (注:本文用于回测的高频数据均来源于通联数据) 1.2、 日内交易重要时 段 : 集合竞价 阶段 沪深交易所日内交易制度差异 细微 。根据沪深交易所最新交易规则,每个交易日 9:15-9:25 为开盘集合竞价阶段, 9:30-11:30 和 13:00-15:00 为连续竞价阶段 ;深交所 交易制度略有差异, 14:57-15:00 为尾盘集 合 竞价阶段。 自2006 年 7 月 1 日起我国股市的集合竞价模式已由封闭式转为开放式 ,此时段的市场有效性和信息透明度均不同程度改变。 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -6- 证券研究报告 图 2:中国股市不同阶段交易制度示意图 资料来源:上海 /深圳 证券交易所,光大证券研究所 集合竞价阶段, 反映投资者行为信息的重要时点 。 我国股票的日内交易分为集合竞价阶段和连续竞价阶段,累计交易时长 4 小时,但并非所有时间的交易信息都具备参考价值。 开盘和收盘是一天中股市交易的 最 重要 的 阶段,开盘集合竞价阶段是隔夜信息释放的第一时点,而收盘 集 合竞价阶段则是日内交易信息反映的最后时点。 集合竞价制度可以防止市场操纵,更能反映投资者对股价的认同度。集合竞价阶段遵从价格优先、时间优先的原则,投资者根据股票前日收盘价及其对当日股价的心理预期输入申报价格。一般而言,集合竞价阶段成交量反映了多空双方对个股开盘价格的认同度。 2、 成交量占比 高频 因子构造 2.1、 因子具体构造方式 价走量先行, 关注集合竞价成交量占比。 市场价格的有效变动必须有成交量的配合,其可谓测量证券市场活跃程度的温度计,对投资者分析主力行为提供了重要依据。 下面我们将具体阐述 在日内 交易 中 重要的集合竞价阶段, 如何 通过高频信号加工构造 适应低频调仓的 成交量占比 因子 。 信号变频 :高频数据转为低频信号 集合竞价阶段的交易数据是 日内高频数据的 特有 部分, 我们以成交量为切入点 ,以相对指标个股集合竞价成交量占比( 集合竞价阶段成交量 /日内总成交量 )为日内高频指标,采用技术分析中最常用指标构造方式 简单移动平均( MA) 构造 开盘 集合竞价成交量占比因子 OCVP( opening call auction volume percent) ,作为月 初 选股的指标 。 = 1()=1其中: :表示每日 开盘前 集合竞价阶段成交量 :表示日内个股总成交量 :表示 第 t 日 向前 移动平均的 交易日个数 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -7- 证券研究报告 高频信息的时间效用:引入具有时变效用的权重因子 集合竞价成交量 属于 日内高频数据 , 根据信息传递过程中的衰减规律,距离指标因子计算日的 时间越长其信息的时效性也会随之递减 ,因此我们进一步考虑 引入具有时变效用的权重因子 修正原始的 OCVP 因子。 指数移动平均( EMA)也是 理想的趋势抓取工具 ,相比于简单 移动平均,它赋予最近期信息的权重最大,也不摒弃远期信息,只是赋予呈指数式衰减的权重。 = =1其 中 = (),每日集合竞价成交量占比 ; : 信息的衰减强度 , = 21+; = (1)1 (1)1=1: 为时间权重因子 。 尾盘效应代理变量:收盘前 5 分钟成交量占比 由于沪深两市交易制度的细微差异,深圳证券交易收盘前 3 分钟属于收盘集合竞价阶段,而上海证券交易所仍处于连续竞价阶段。如果开盘集合竞价阶段是每日夜间休市阶段累积情绪的第一释放时间,那么收盘前几分钟则是白天交易期间累积情绪的最后释放时间,其中的交易者行为同样蕴含着额外的信息量。为了统一沪深两市,我们选择收盘前 5 分钟的交易信息作为尾盘效应时段,以与 OCVP 同样的方式构造收盘前成交量占比因子 BCVP( before closing volume percent)。 = 1()=1其中: :表示收盘前 5 分钟内个股成交量 :表示日内个股总成交量 :表示第 t 日向前移动平均的交易日个数 3、 OCVP 因子具备 较 理想的选股能力 3.1、 因子特征 分析 OCVP 因子呈 “ 尖峰、厚尾” 。 我 们以前 10 个交易日 计算的 OCVP 因子为例,可以看到 该因子呈现出金融数据常见的“右偏、尖峰、厚尾”分布特征 。在因子测试阶段这种与正态分布偏离度较大的情况下不适用 3-sigma原则去极值,我们采用稳健的 MAD(绝对中位数法)去除极值更加合适。 OCVP 因子与次月收益负相关性较强 。 对初始 OCVP 因子与股票次月收益率相关性 进行研究,从 2010 年至今 90 个月的相关系数均值为 -0.03,相关系万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -8- 证券研究报告 数小于零的比例超过 65%。 据此可 得初步结论:集合竞价成交量占比越低,股票次月的收益率越高, 月初 调仓 时 更倾向于配置 OCVP 因子值小的组合。 图 3: OCVP 因子的分布 ( 2017 年 6 月的因子数据为例) 图 4: OCVP 因子与股票次月收益率 呈现一定负相关性 资料来源: 光大证券研究所 资料来源:光大证券研究所 , 注: 2010.02.01-2017.07.31 OCVP 因子存在一定 的 行业和市值 差异性 。 为了排除股票所属行业、市值 等外部因素的影响, 需要 考察因子在不同行业和市值的分布情况。 我们分别以沪深 300 成分股、中证 500 成分股中市值最小的作为大市值、中市值和小市值的分界点, OCVP 因子的中位数和平均数均存在差异,小市值的股票对应的因子值一般较小。 按照中信一级行业划分,金融行业的 OCVP 因子中位数较大 。 综上结论我们在 随后 的因子有效性检验时对其做行业中性和市值中性处理。 图 5: OCVP 因 子不同市值中位数与平均数 图 6: OCVP 因子的行业分布中位数 资料来源: 光大证券研究所 资料来源:光大证券研究所 3.2、 OCVP 因子有效性 优于 BCVP 对于因子数据的标准化处理和有效性检验我们仍沿用 多因子系列报告中的方法。 有效性及稳定性检验 : 采用多期截面 RLM 回归后我们可以得到因子收益序列 ,以及每一期回归假设检验 T 检验的 t 统计量 序列,针对这两个序列我们通过以下几个指标来判断该因子的有效性 和 稳定性: 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -9- 证券研究报告 ( 1) 因子收益序列 的假设检验 t 统计量 值 ( 2) 因子收益序列 大于 0 的概率 ( 3) t 统计量 绝对值的均值 ( 4) t 统计量 绝对值大于等于 2 的概率 有效性及预测能力检验 : 我们 计算 行业中性与市值中性处理后的 Rank IC(因子值与股票次月收益率 的 秩相关系数) , 通过 以下几个与 IC 值相关的指标来判断因子的有效性和预测能力: ( 1) IC 值的均值 ( 2) IC 值的标准差 ( 3) IC 大于 0 的比例 ( 4) IC 绝对值大于 0.02 的比例 ( 5) IR( IR = IC 均值 /IC 标准差) 因子分组回测框架 通过因子值的排序对股票分组,根据每组 股票 的历史收益情况判断因子的单调性。 表 1:因子分 组 回测框架 因子 分组 回测框架 时间区间 2010 年 2 月 1 日至 2017 年 7 月 31 日 股票池 全部 A 股 ( 剔除选股日 ST/PT 股票; 剔除上市不满一年的股票;剔除选股日由于停牌等因素无法买入的股票) 调仓频率 月度调仓 分组 调仓方式 每月最后一个交易日收盘后,根据本月所有未被剔除的股票数据计算因子 值,根据因子值从小到大排序将股票等分为 5 组,分别计算每组股票的历史回测收益 及多空组合收益 。 交易费率 因子测试阶段 暂 不考虑交易费用 资料来源:光大证券研究所 3.2.1、 因子数据清洗与标准化 时间轴上 ,个股存在停牌情形,对于包含停牌 日缺失 数据的移动平均需做一些限制性处理以得到更为合理的 因子数据。 横截面上 ,不同的股票之间存在个体差异性,原始的 OCVP 因子在股票间的横向可比性较低,因此我们对截面因子数据做标准化处理 ,获得因子的相对值。 ( 1) 缺失值处理: d 个交易日 的 移动平均至少有 5 个交易日 为 非缺失值; ( 2)极值处理: 因子 的分布 与正态分布偏离度较大的 , 不适用 3-sigma 原则去极值,我们采用稳健的 MAD(绝对中位数法)去除极值更加合适。 采取与 3 法等价的方法,用 将原始因子值调整到 3 倍绝对偏离中位数的范围内。 万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -10- 证券研究报告 ( 3) 标准化处理: 通过 横截面 z-score 方法 , 以每个时间截面 t 上的所有股票的为样本,分别计算其均值和标准差得到如下所示的 stand(OCVP)。 此 标准化 方式属于因子的线性变换,并不会改变原始 OCVP 因子的分布特征 。 stand() = () 3.2.2、 因子有效性检验 OCVP 因子的有效性 、稳定性及 预测能力 表现良好 。因子 IC 大于零的比例仅为 14.1%,说明因子与未来收益 呈现较显著的 负相关性;此外 IC 均值为-5.6%, IR 绝对值 为 0.83,该因子的预测能力较突出。 BCVP 因子的有效性 、稳定性及 预测能力 稍逊于 OCVP。因子 IC 大于零的比例为 36%,因子与未来收益呈现较强的负相关性;此外 IC 均值为 -2.8%,IR 绝对值为 0.36,该因子的预测能力相对 OCVP 较弱一筹。 表 2: OCVP 与 BCVP 因子有效性 测试结果 对比 OCVP 因子有效性测试指标 BCVP 因子有效性测试指标 因子收益率均值 -0.40% -0.29% 因子收益显著性 -6.88 -3.85 IC 均值 -5.6% - 2.8% IC 0 比例 14.1% 36% IC 0.02 比例 11.2% 27% IC 标准差 6.7% 7.6% 信息比 IR -0.83 -0.36 资料来源:光大证券研究所 OCVP 因子具备良好的单调性 ,分层效应显著 。 我们对比因子分组 回测 净值及多空对冲 净值 ,从下图 可以看到, OCVP 因子的分组效果很好,随着因子值的上升,分组收益逐渐下降 ,分组 收益 区分度明显 ; 多空组合 ( 第一组对冲第五组 ) 年化收益约 11.50%, 夏普 比率为 1.98, 最大回撤 达 19.5%。 图 7: OCVP 因子 Rank IC 序列 图 8: OCVP 因子单调性 显著 资料来源: 光大证券研究所 资料来源:光大证券研究所 ,注: 2010.02.01-2017.07.31 0 . 511 . 522 . 533 . 52 0 1 0 /2 /1 2 0 1 1 /2 /1 2 0 1 2 / 2 / 1 2 0 1 3 /2 /1 2 0 1 4 / 2 / 1 2 0 1 5 /2 /1 2 0 1 6 /2 /1 2 0 1 7 /2 /1G r o u p _1 (因子最小)G r o u p _2G r o u p _3G r o u p _4G r o u p _5 (因子最大)L o n g _S h o r t万得资讯2017-09-01 金融工程 敬请参阅最后一页特别声明 -11- 证券研究报告 BCVP因子单调性 较差 , 因子值最大组显著跑输其余组别 。 从下图可以 发现 ,BCVP 因子的分组效果较 一般 , 第五组显著跑输其余组别 ;多空组合(第一组对冲第五组)年化收益约 12.40%,夏普比率 1.12,最大回撤为 14.5%。 图 9: BCVP 因子 Rank IC 序列 图 10: BCVP 因子单调性尚可 资料来源: 光大证券研究所 资料来源:
展开阅读全文