资源描述
敬请参阅最后一页特别声明 1 S1130522110003 gaozhiw S1130522050001 mengcan zhao_yan S1130522080001 wangqianwen ChatGPT 带动 AI 板块景气度持续提升 2022 年 11 月 OpenAI 发布语音聊天机器人 ChatGPT,推出仅 2 个月用户数已过亿。模型可赋能语音客服、搜索引擎、文字创作等丰富场景,并衍生出更多算力和数据需求,有望带动 AI 板块景气度持续提升。ChatGPT 作为迄今为止AI大模型最接近商用落地的成果,输出内容接近人类的常识、认知、需求和价值观。其采用的InstructGPT 方法有望成为新一代 AI 开发范式,将极大程度促进语言类 AI 大模型的多场景落地。目前国内在 ChatGPT 相关领域进展较快的企业包括百度、科大讯飞、商汤科技、阿里巴巴等。其中,百度宣布将于3月推出人工智能聊天机器人“文心一言”(ERNIE Bot),目 前已 有包 括企 业软 件、媒体、汽 车、互联 网等 多个 行业 近300 家头部企业宣布加入“文心一言”生态。此外,百度还于 2 月 17 日宣布“文心一言”将通过百度智能 云对外提供服务,赋能更多行业发展。大模型对算力和数据均提出更高要求,将提振上游 GPU 等硬 件设 备、云计 算及 数据 标注 行业 的景 气度。从算力角度看,大模型对算力有着极大的消耗。增加训练参数规模是提升大模型性能最直接的方法之一,预计未来各头部 AI 厂商的“大模型军备竞赛”仍将持续。从训练数据角度看,ChatGPT 对高质量训练数据集需求提升。未来其他大模型训练或也将引入更多人工标注数据,将为相关企业带来新的发展机遇。随着未来GPT 系列模型对数据质量的要求进一步提升,拥有高质量数据的流量平台或可通过提供数据等方式进入产业 链,带动大数据领域加速发展。大 数 据 指数 布局 ChatGPT 概念 板块 中证大数据产业指数由中证指数有限公司发布,经过测算发现,在目前市场上与 ChatGPT 相关的中证指数中,中证大数据产业指数与万得 ChatGPT 概念指数的相关性最高,两者 日度收益率 相关系数达到 86.00%,为广 大投 资者 提供 了 投资 ChatGPT 概念的绝佳机会。中证大数据产业指数成分股共覆盖13 个中信三级行业,主要集中在行业应用软件(29.82%)、通用 计算 机设 备(16.38%)、云软 件服 务(15.67%)、云基 础 设施 服务(14.93%)和新 兴计 算机 软件(9.57%)这 5 个行 业,合计 权重 占比 达到 86.37%。在 13 个中信三级行业中,其中 7 个行业同样出现在万得 ChatGPT 概念指数成分股中,较全面的涵盖了 ChatGPT 的概念股票所处细分行业。长期 来看,中证 大数 据产 业指 数相 较于 宽基 指数 获得 了显 著的 超额 收益。夏普比率和今年以来收益率也显著高于三大宽基指数。根据 万得 一致预测净利润同比(FY2 比 FY1),大数据产业指数的预测净利润同比达到 53.12%,远高 于各 宽基指数的水平。充分说明了分析师对于未来大数据产业高速成长的乐观预 期。大数据 ETF(515400)优势明显,快速把握 ChatGPT 投资机会 大数据 ETF(515400)是国内最早跟踪中证大数据产业指数的 ETF 基金产品,截至 2 月 17 日,基金总资产净值 达 到6.97 亿元,2 月份成交金额达到 9.64 亿元,流动性上优势 明显。近期成分股中北上资金持股占比稳步上升,受到 外资的广泛关注。管理人富国基金在 ETF 领域全面布局,拥有丰富的 ETF 管理经验。综上,大数据 ETF(515400)是投资者参与 ChatGPT 概念投资可选择的 优质 投资标的。风险提示 基金历史业绩不代表未来;以上结果通过历史数据统计和测算完成,在政策、市场环境发生变化时存在失效风险;行业发展不及预期风险。金融工程专题报告 敬请参阅最后一页特别声明 2 内容目录 一、ChatGPT 带动 AI 板块景气度持续提升,看好上游算力及数据标注行业增长.4 1.1 人工智能算法实现底层骨干网络统一,无监督、半监督成为主流训练模式.4 1.2 ChatGPT 有望赋能丰富场景,将带动算力和数据需求提升.5 二、大数据指数布局 ChatGPT 概念板块.7 2.1 指数基本信息.7 2.2 大数据指数与 ChatGPT 概念相关性分析.7 2.3 指数成分股行业分析.7 2.4 指数成份股市值分析.8 2.5 指数前十大成分股分析.8 2.6 指数表现.9 2.7 指数盈利预测.10 三、大数据 ETF(515400)优势明显,快速把握 ChatGPT 投资机会.10 3.1 ETF 基本信息.10 3.2 规模大,交易活跃,大数据 ETF(515400)优势明显.11 3.3 大数据 ETF(515400)获得北上资金青睐.11 3.4 ETF 跟踪误差分析.11 3.5 基金管理人介绍.12 3.6 基金经理简介.13 风险提示.13 图表目录 图表 1:ChatGPT 模型演进历程.4 图表 2:监督学习与无监督学习方式对比.4 图表 3:ChatGPT 有望促进 AI 大模型多场景落地.5 图表 4:GPT-3 API 定价情况.5 图表 5:百度“文心一言”合作生态丰富.5 图表 6:语言类大模型规模快速提升.6 图表 7:大模型训练所需 算力呈指数增长.6 图表 8:训练成本与模型参数量正相关.6 金融工程专题报告 敬请参阅最后一页特别声明 3 图表 9:中证大数据产业指数(930902)基本信息.7 图表 10:万得 ChatGPT 概念指数与各指数相关系数.7 图表 11:万得 ChatGPT 概念 指 数 VS 中证大数据产业指数.7 图表 12:中证大数 据产业指数行业分布.8 图表 13:指数成分股总市值不同区间数量分布.8 图表 14:指数成分股总市值不同区间权重分布(%).8 图表 15:中证大数据产业指数前十大成分股信息.8 图表 16:中证大数据产业指数与各宽基指数净值走势比较.9 图表 17:中证大数据产业指数与各宽基指数收益波动表现.9 图表 18:中证大数据产业指数与各宽基指数一致预测净利润同比(%)(FY2 比 FY1).10 图表 19:大数据 ETF(515400)产品要素.10 图表 20:大数据 ETF(515400)月度成交额及规模变化.11 图表 21:大数据 ETF 成分股北上资金持股占比.11 图表 22:大数据 ETF 成分股北上资金持股占比变化.11 图表 23:大数据 ETF(515400)净值与跟踪指数净值走势.12 图表 24:富国基金旗下 ETF 产品分布(单位:只).13 图表 25:基金经理在管基金一览(截至 2023.02.17).13 金融工程专题报告 敬请参阅最后一页特别声明 4 一、ChatGPT 带动 AI 板块景气度持续提升,看好上游算力及数据标注行业增长 目前在 AI 算法层面,Transformer 已完成底层骨干网络的统一,开启大模型时代;在模型训练层面,无监督和半监督学习成为大模型训练的主流方式。以此为基础,2022 年 11 月 OpenAI 发布语音聊天机器人 ChatGPT,推出 仅2 个月用户数 已过 亿。模型 可赋 能语 音客 服、搜索 引擎、文字 创作 等丰 富场 景,并衍 生出 更多 算力 和数 据需 求,有望 带动 AI 板块景气度持续提升。1.1 人 工 智 能算 法实 现底 层骨 干网 络统 一,无监 督、半监 督成 为主 流训 练模 式 神经网络的发展以 Relu 激活函数的提出为分水岭,分为浅层神经网络和深度学习两个阶段。目前深度学习算法主要是基于 Transformer 骨干网络进行分支网络的创新,如引入扩散模型、强化学习等方法。模型骨干网络的统一有望加速应用落地节奏。在浅层神经网络阶段,最重要的任务就是解决梯度不稳定的问题。在这个问题未被妥善解决之前,神经网络应用性能不佳,而属于非神经网络的支持向量机算法(SVM)是解决人工智能模式识别的主流方法。2011 年 Relu 激活函数被提出、梯度消失问题被大幅缓解之后,神经网络进入深度学习时代,算法和应用的发展均突飞猛进。最初 CNN、RNN 等模型在不同的模态和任务中均各有擅长,2017 年 Transformer 的提 出让 深度 学 习进入了大模型时代、2020 年 Vision Transformer 的提出让深度学习进入了多模态时代,自此多模态和多任务底层算法被统一为 Transformer 架构。后续 模型 发展 多采 用“Transformer+其他算法”的形式进行微创新。目前大火的 ChatGPT 模型也采用 Transformer 骨干网络,并融合强化学习思想进行训练。图表1:C h a t G P T 模 型 演进 历程 来源:On the Comparability of Pre-trained Language Models(Matthias,2020),Evaluating Large Language Models Trained on Code(Mark Chen,2021),OpenAI,BFT 智能机器人研究公众号,国金证券研究所 算法、数据、算力 是 AI 三要 素,在 AI 相关 技术 中,训练 方法 作为 搭建 模型 的核 心技 术与 AI 三要素间均有紧密联系。AI 模型的训练方法主要包括监督学习与无监督学习两种典型方式,二者的区别在于是否使用带人工标注的数 据 集 进行训 练。随着 模型 训练 数据 量的 增加,标记 大量 样本 成本 过于 昂贵,衍生 出使用大量未标注数据和少量标注数据的半监督学习方式。目前大模型训练多采用无监督(如 BERT)或半监督(如 InstructGPT/ChatGPT)的方式进行训练。图表2:监 督 学 习与 无监 督学 习方 式对 比 来源:CSDN 云计算,国金证券研究所 金融工程专题报告 敬请参阅最后一页特别声明 5 1.2 ChatGPT 有望 赋能 丰富 场景,将 带动 算力 和数 据需 求提 升 ChatGPT 作为迄今为止 AI 大模型最接近商用落地的成果,输出内容接近人类的常识、认知、需求和价值观。其采用的InstructGPT 方法有望成为新一代 AI 开发范式,将极大程度促进语言类 AI 大模型的多场景落地。图表3:ChatGPT 有望促进 AI 大模 型 多场 景落 地 场景 ChatGPT 优势 AI 客 服、语音助手 现有的 AI 问答机器人仅能回答具体场景的定制式问题,通过调用 ChatGPT 相关技术有望帮助企业提升用户体验 搜索引擎 相较于传统搜索引擎,ChatGPT 能够更好地理解客户需求并输出更为精简的内容,但目前模型更新的成本较高 文字创作 ChatGPT 在邮件、新闻稿撰写方面与人工水平相近,可承担日常性文字创作工作,可作为办公软件的增值服务 医疗 协助医生进行患者随访,电子病历撰写,辅助诊断等 教育 辅助教师进行课程设计和备课教研,充当课堂助教实时回答学生问题,生成作业测验和考试 游戏 生成符合 NPC 角色设定的对话,丰富场景体验,也可辅助生成游戏 金融 帮助金融机构监测行业趋势、财务数据、舆情走向等,快速生成财务分析报告或风险评估报告 计 算 机 代码 有望辅助程序员完成部分重复和基础性开发工作 来源:36 氪,CHIMA 公众号,中国高等教育培训中心公众号,量子位公众号,中小银行互联网金融联盟公众号,国金证券研究所 短期 来看,在语 言大 模型 领域,国内 外 AI 巨头与最先进的 GPT-3.5 仍存在一定技术差距,预计在未来 1-2 年内 OpenAI仍将保持最领先的技术地位。国内在大模型领域积累深厚、现金流充足的头部 AI 企业有望率先实现技术突破,参照OpenAI 目前的商业模式,未来 AI 厂商的大模型变现方式可分为以下 2 类:直接收费:目前 OpenAI 已推出付费版 ChatGPT plus,价格为 20 美元/月。赋能收费:根据 OpenAI 于 2021 年 3 月发布的数据,GPT-3 模型已经向超过 300 个应用提供 SaaS 服务,平 均 每天生成 45 亿词,根 据我们的估算,这将为 OpenAI 带来每年约 740 万美元的收入。此外,2023 年 2 月 8 日起ChatGPT 与微软搜索引擎必应相连,新的交互模式极大增加了必应的用户活跃度,有望推动微软的广告服务收入大幅增长。图表4:GPT-3 API 定价情况 模型名称 微 调 训 练价格 使用价格 Ada(速度最快)0.4 美元/75 万词 1.6 美元/75 万词 Babbage 0.6 美元/75 万词 2.4 美元/75 万词 Curie 3 美元/75 万词 12 美元/75 万词 Davinci(性能最好)3 美元/75 万词 120 美元/75 万词 来源:OpenAI,国金证券研究所 目前国内在 ChatGPT 相关领域进展较快的企业包括百度、科大讯飞、商汤科技、阿里巴巴等。其中,百度宣布将于3月推出人工智能聊天机器人“文心一言”(ERNIE Bot),目 前已 有包 括企 业软 件、媒体、汽 车、互联 网等 多个 行业 近300 家头部企业宣布加入“文心一言”生态。此外,百度还于 2 月 17 日宣布“文心一言”将通过百度智能云对外提供服务,赋能更多行业发展。图表5:百度“文心一言”合 作生 态丰 富 领域 合作公司 企业服务 致远互联、金蝶国际、汉得信息、东软集团、远光软件、飞天云动等 金融工程专题报告 敬请参阅最后一页特别声明 6 领域 合作公司 金融IT 宇信科技、银之杰、科蓝软件、软通动力、信雅达等 汽车 东风日产、红旗汽车、长城汽车、汽车之家等 传媒 风语筑、太平洋网络、财讯传媒、超媒体控股、掌阅科技、华策影视、蓝色光标等、爱奇艺等 其他 联想集团、携程集团、四川长虹、TCL、邮储银行、航天宏图等 来源:各公司公众号,国金证券研究所 大模型对算力和数据均提出更高要求,将提振上游 GPU 等硬件设备、云计算及数据标注行业的景气度。从算力角度 看,GPT-3 模型中包含 1,750 亿个参数,训练消耗算力约为 3.1*108 PFLOPs。2021 年起 AI 巨头陆续推出 Gopher、PaLM 等语言大模型,不断刷新算力消耗纪录。其中,2022 年 4 月由 Google 发布的PaLM 参数量达到 5,400 亿,消耗 算力 约为 GPT-3 的 8 倍。增加 训练 参数 规模 是提 升大 模型 性能 最直 接的 方法 之一,预计 未 来各头部 AI 厂商的“大模型军备竞赛”仍将持续。图表6:语 言 类 大模 型规 模快 速提 升 图表7:大 模 型 训练 所需 算力 呈指 数增 长 来源:Hugging Face,国金证券研究所 来源:Compute Trends Across Three Eras of Machine Learning(Jaime 等,2022),国金证券研究所 大模型相关算力成本可分为训练成本和推理成本,训练成本是指从头开发一个AI 模型、或对 现有 AI 模型知识库进行迭代更新所需的算力,推理成本则用于衡量用户使用 AI 模型时产生的算力消耗。根据 OpenAI 在 2020 年发表的研究,AI 模型训练成本可通过以下 5 个指标计算估计:模型参数规模、训练数据集大小、GPU 峰值算力、GPU有效算力比率、GPU 集群价格。图表8:训 练 成 本与 模型 参数 量正 相关 来源:Scaling Laws for Neural Language Models(Jared Kaplan 等,2020),国金证券研究所 由于大批量购置 GPU 成本过高,海外 AI 厂商多通过 Microsoft Azure、Google Cloud、AWS 等云计算平台获得算力支持。以 ChatGPT 为例,模型参数为 1,750 亿,算力由Microsoft Azure 提供,采用峰值算力为 312PFLOPS 的NIVIDIA A100 训练。我们 假设 模型 训练 集大 小为 4,000 亿 Tokens,GPU 有效算力比率为 30%,可以 得出 使用 云计算时 ChatGPU 的一次训练成本约为 170 万美 元。模型 训练 成本 对应 GPU 服务器厂商的营业收入,随国内大模型 训练进一步推进,相关云计算厂商收入有望持续增长。从训练数据角度看,ChatGPT 由 GPT 的 few shot 向 prompt learning 进一步转变,对高质量训练数据集需求提升。OpenAI 在训练 InstructGPT 时专门成立了 40 人的数据标注团队,通过人工反馈的方式进行模型微调,这 种方法是 ChatGPT“善解人意”的主要原因之一。InstructGPT 为后续语言大模型提供了新的训练范式,未来其他大模型训练或也将引入更多人工标注数据,将为相关企业带来新的发展机遇。金融工程专题报告 敬请参阅最后一页特别声明 7 此外,目前 GPT 系列模型使用的训练数据多来自网页爬取、已发表文章书籍、维基百科等数据集。未来随模型训练、落地 应用 对数 据质 量的 要求 进一 步提 升,叠加 信息 安全、知识 产权 等因 素,拥有 高质 量数 据的 流量 平台 或可通过提供数据服务或自行开发大模型等方式进入产业链,将带动大数据领域加速发展。二、大 数据 指数 布局 ChatGPT 概念 板块 2.1 指 数 基 本信 息 中证大数据产业指数由中证指数有限公司于 2016 年 10 月 18 日发布,基 日为 2012 年12 月31 日。主要 选取 涉及 大 数据存 储设 备、大数 据分 析技 术、大数 据运 营平 台、大数 据生 产、大数 据应 用等 热门 领域的沪深 A 股为样本,能反 映大数据产业上市公司的整体表现。图表9:中 证 大 数据 产业 指数(930902)基本信息 要素 内容 指数名称 中证大数据产业指数 指数代码 930902.CSI 指数简称 中证数据 样本空间(1)上市时间超过一个季度,除非该股票自上市以来的日均 A 股总市值在全部沪深 A 股中排在前 30 位;(2)非 ST、*ST 股票、非暂停上市股票。选样方法(1)对样本空间内证券按照过去一年的日均成交金额由高到低排名,剔除排名后 20%的证券;(2)对样本空间内剩余证券,将业务涉及大数据存储设备、大数据分析技术、大数据运营平台、大数据生产、大数据应用等领域的上市公司证券归为大数据产业主题;(3)将上述待选样本按照过去一年日均总市值由高到低排名,选取排名靠前的 50 只上市公司证券作为指数样本。样本股定期调整 每半年调整一次,样本调整实施时间分别为每年 6 月和 12 月的第二个星期五的下一交易日。来源:Wind,国金证券研究所 2.2 大 数 据指 数与 ChatGPT 概念相关性分析 万得于近期发布了 ChatGPT 概念 指数(8841669.WI),基日 为 2018 年 12 月31 日,该指 数能 够较 好地 反映ChatGPT 相关产业链上市公司的价格走势。我们计算了自2018 年12 月31 日至2023 年2 月17 日的指数 日收益率相关系数发现,在目前市场上与 ChatGPT 相关的中证指数中,中证大数据产业指数与万得 ChatGPT 概念指数的 相关性最高,两者 相关系数达到 86.00%,为广大投资者提供了投资 ChatGPT 概念的绝佳机会。图表10:万得 ChatGPT 概念指数与各指数相关系数 图表11:万得 ChatGPT 概念指数VS 中证大数据产业指数 来源:Wind,国金证券研究所 来源:Wind,国金证券研究所 2.3 指 数 成分 股 行业 分析 从行业分布来看,截至 2023 年 2 月 17 日,中证大数据产业指数成分股共覆盖 13 个中信 三级行业,主要集中在 行业应用 软件(29.82%)、通用 计算 机设 备(16.38%)、云软 件服 务(15.67%)、云基 础设 施服 务(14.93%)和新 兴计 算机 软件(9.57%)这 5 个行业,合计 权重 占比 达到 86.37%。在13 个中信三级行业中,其中 7 个行业同样出现在万得 ChatGPT概念指数 成分股 中,较全面的涵盖了 ChatGPT 的概念股票 所处细分行业。65.00%70.00%75.00%80.00%85.00%90.00%0.00000.50001.00001.50002.00002.5000万得ChatGPT 概念指数 中证大数据产业指数金融工程专题报告 敬请参阅最后一页特别声明 8 图表12:中 证 大 数据 产业 指数 行业 分布 行业名称 成分个数 权重(%)行业应用软件 19 29.82 通用计算机设备 6 16.38 云软件服务 3 15.67 云基础设施服务 9 14.93 新兴计算机软件 1 9.57 专用计算机设备 2 4.04 咨询实施及其他服务 3 2.66 储能 1 2.07 游戏 1 1.22 增值服务 1 1.13 基础软件及管理办公软件 2 1.12 互联网广告营销 1 0.86 集成电路 1 0.54 来源:Wind,国金证券研究所 2.4 指 数 成份 股 市值 分析 从截至 2023 年 2 月 17 的数据来看,中证大数据产业指数的50 只成 份股 中,总市 值区 间在 50 至 100 亿元、100 至 200亿元的数量较多,分别有 19 只和 15 只,数量合计占比 68%。从权重来看,总市值区间在 500 至 1000 亿元 的占 比 较高,共有 8 只股票,权重占比为 43.55%。整体而言 中小市值股票数量较多,但权重 分布较为均衡。图表13:指 数 成 分股 总市 值不 同区 间数 量分 布 图表14:指 数 成 分股 总市 值不 同区 间权 重分 布(%)来源:Wind,国金证券研究所 来源:Wind,国金证券研究所 2.5 指 数 前十 大 成分 股分 析 截至 2023 年 2 月 17 日,指数 的前十大成分股 权重合计为 57.62%,有 8 只股票的总市值在 500 亿元以上。其中 囊 括了 AI 语音领域的龙头企业科大讯飞、券商 IT 行业的领军企业恒生电子和国内头部 ERP 供应商用友网络等。图表15:中 证 大 数据 产业 指数 前十 大成 分股 信息 代码 简称 权重(%)总市值(亿)中 信 三 级行业 公司介绍 002230.SZ 科大讯飞 9.57 1085.19 新兴计算机软件 AI 语音领域龙头,深耕教育、智慧城市、医疗、汽车、智能硬件等赛道,预计今年五月推出融合 ChatGPT 技术的硬件产品 600570.SH 恒生电子 9.11 835.43 行业应用软件 券商 IT 行业领军企业,代表产品包括集中交易系统 UF3.0、资管交易系统 045,目前公司已进入人效提升期 002410.SZ 广联达 7.90 719.12 云软件服务 定位为数字建筑平台服务商,为客户提供建设工程领域专业的软硬件产品和解决方案、产业大数据、产业新金融等服务 600588.SH 用友网络 6.41 798.27 云软件服务 国内头部 ERP 供应商,面向企业与公共组织提供平台及财务、人191578150,100)100,200)200,500)500,1000)=100013.5116.5516.8343.559.5750,100)100,200)200,500)500,1000)=1000金融工程专题报告 敬请参阅最后一页特别声明 9 代码 简称 权重(%)总市值(亿)中 信 三 级行业 公司介绍 力、协同、营销、采购、供应链、制造、研发、资产等领域企业云服务 000938.SZ 紫光股份 5.84 654.39 通用计算机设备 子公司新华三是国内领先的 ICT 设备商,在以太网交换机、企业网路由器、X86 服务器等多个领域连续多年市占率第一。公司于23 年1 月启动收购新华三剩余 49%股权,有望实现利润大幅增厚 300454.SZ 深信服 4.78 565.24 云基础设施服务 公司成立之初聚焦于网络安全领域,多项产品市占率第一,2012年开始布局云计算,2021 年正式宣布 XaaS 战略,由“安全+云化“向”云化+服务化“转型 600845.SH 宝信软件 3.74 944.89 云基础设施服务 国内钢铁信息化、工业软件、IDC 和工业互联网等多个领域的龙头企业,有望随 AI 算力需求增长实现 IDC 相关收入高增 002405.SZ 四维图新 3.62 303.25 行业应用软件 我国高精度地图领先厂商,业务布局包括位置大数据、车联网、自动驾驶、车载芯片等领域 603019.SH 中科曙光 3.58 407.29 通用计算机设备 我国数字基础设施建设领军企业,拥有高性能计算、存储产品、软件开发及技术服务三大业务体系,是国产 x86 架构芯片龙头海光信息的第一大股东 000977.SZ 浪潮信息 3.08 534.4 通用计算机设备 国内 AI 算力龙头,产品覆盖服务器、存储及终端领域,在 AI 加速服务器领域市占率达 50.7%。来源:Wind,国金证券研究所 2.6 指 数 表现 长期来看,中证大数据产业指数 相较于宽基指数 获得 了 显著的超额收益。自基日起至 2023 年 2 月 17 日,指数 总 收 益率为 197.42%,同期沪深 300 收益率为 62.68%,中证 500 收益率为 92.80%,中证 1000 收益率为 103.27%。且大数据指数的夏普比率为 0.49,也高 于各大宽基指数的收益风险水平。今年以来,市场对于相关概念 热情 高涨,大数 据产 业指数的收益率达到 17.15%,远高于各宽基指数 中表现较好的中证 1000 指数 9.34%的水平。图表16:中 证 大 数据 产业 指数 与 各 宽基指数 净值走势 比较 来源:Wind,国金证券研究所 图表17:中 证 大 数据 产业 指数 与各 宽基 指数 收益 波动 表现 中 证 大 数据产业指数 沪深300 中证500 中证1000 总收益率 197.42%62.68%92.80%103.27%年化收益率 11.71%5.07%6.90%7.48%0123456789中证大数据产业指数 沪深300 中证500 中证1000金融工程专题报告 敬请参阅最后一页特别声明 10 中 证 大 数据产业指数 沪深300 中证500 中证1000 夏普比率 0.49 0.28 0.35 0.37 今年以来收益率 17.15%4.21%6.36%9.34%来源:Wind,国金证券研究所 2.7 指 数 盈利 预 测 根据万得提供的一致预测数据,我们利用一致预测净利润同比(FY2 比 FY1)考察 分析 师对 于该 指数 的 未来预期表现,发现 大数据产业指数的预测净利润同比达到 53.12%,远高 于各 宽基 指数 的水 平。充分说明了分析师对于 未来 大数据产业高速成长的乐观 预期。图表18:中 证 大 数据 产业 指数 与各 宽基 指数 一致 预测 净利 润同 比(%)(FY2 比 FY1)来源:Wind,国金证券研究所 三、大 数据 ETF(515400)优势明显,快速把握 ChatGPT 投资机会 3.1 ETF 基本信息 大数据 ETF(515400)是富国基金管理有限公司发行的一只指数型 ETF,于 2021 年 1 月 20 日上市。其投资目标是 紧密跟踪中证大数据产业指数,追求跟踪偏离度和跟踪误差最小化。该基金 是国内最早跟踪该指数的 ETF 基金产品,值得投资者密切关注。图表19:大数据 ETF(515400)产品 要 素 要素 内容 基金 全称 富国中证大数据产业交易型开放式指数投资基金 基金简称 富国中证大数据产业 ETF 基金代码 515400 上市日期 2021 年 1 月20 日 基金类型 交易型开放式指数证券投资基金(ETF)基金管理人 富国基金管理有限公司 基金托管人 中信证券股份有限公司 基金经理 蔡卡尔 比较基准 中证大数据产业指数收益率 投资目标 紧密跟踪标的指数,追求跟踪偏离度和跟踪误差最小化。产品费率 管理费率 0.5%,托管费率 0.1%0.0010.0020.0030.0040.0050.0060.00中证大数据产业指数 沪深300 中证500 中证1000金融工程专题报告 敬请参阅最后一页特别声明 11 来源:Wind,国金证券研究所 3.2 规 模 大,交 易活 跃,大数 据ETF(515400)优势明显 目前市场中跟踪中证大数据产业指数的 指数 基金共 3 只,均为 ETF。作为国内最早跟踪中证大数据产业指数的 ETF,截至 2023 年 2 月 17 日,富国大数据产业 ETF 总资产净值为 6.97 亿元,在 3 只中证大数据产业 ETF 中,规模 最 大,优势明显。在 3 只中证大数据产业 ETF 中,大数据 ETF(515400)交易活跃度最高。自上市以来,大数据 ETF(515400)月成交额不断提高,截至 2 月 17 日,该 ETF2 月份的成交金额已达到 9.64 亿元,其二级市场的高流动性具有 显著 优势。图表20:大数据 ETF(515400)月度 成 交额 及规 模变 化 来源:Wind,国金证券研究所 3.3 大数据ETF(515400)获得 北上资金 青睐 我们根据 ETF 成分股股票池内北上资金持股情况计算 了 北上资金持股 占比(即陆股通在 ETF 成分股范围内个股上的 持仓市值之和占所有个股自由流通市值之和的比例)和北上资金持股变化(即北上资金持股 占比 与上期 占比 的差 值)。发现大数据 ETF(515400)成分 股的 北上 资金 持股 占比 自 2019 年以来一直稳步上行,同时近 半年来 北上 资金 的持 股 变化也 得到大幅改善。外资持续加仓大数据 ETF 的成分股,表明 大数据作为 ChatGPT 概念 的核心 板块,受到了 外资的 广泛关注。图表21:大数据 ETF 成分 股北 上资 金持 股 占比 图表22:大数据 ETF 成分 股北 上资 金持 股 占比 变化 来源:Wind,国金证券研究所 来源:Wind,国金证券研究所 3.4 ETF 跟踪误差分析 自成立以来,大数据 ETF(515400)紧密跟踪了标的指数,跟踪误差维持在较低水平。截至 2023 年 2 月 17 日,基 金相对于中证大数据产业指数年化跟踪误差仅为 0.59%,远小于 2%的跟踪误差阈值。证明该基金作为被动指数型基金,能够紧密跟踪标的指数,风险控制较为有效。0123456780123456789102021-01-292021-02-282021-03-312021-04-302021-05-312021-06-302021-07-312021-08-312021-09-302021-10-312021-11-302021-12-312022-01-312022-02-282022-03-312022-04-302022-05-312022-06-302022-07-312022-08-312022-09-302022-10-312022-11-302022-12-312023-01-31成交金额(亿元)基金资产净值(亿元,右 轴)00.010.020.030.040.050.060.070.080.090.12016063020161031201702282017063020171031201802282018062920181031201902282019062820191031202002282020063020201030202102262021063020211029202202282022063020221031-0.03-0.02-0.0100.010.020.030.042016063020161031201702282017063020171031201802282018062920181031201902282019062820191031202002282020063020201030202102262021063020211029202202282022063020221031金融工程专题报告 敬请参阅最后一页特别声明 12 图表23:大数据 ETF(515400)净值 与 跟踪 指数 净值 走势 来源:Wind,国金证券研究所 3.5 基金管理人介绍 富国基金管理有限公司成立于 1999 年,是国内首批十家基金管理公司之一,注册资本为 5.2 亿元。截至 2022 年 12月 31 日,公司 管理 的基 金规 模为 8527.92 亿元,基金 数量 共有 287 只。其中非货币型基金管理规模为 5840.68 亿元,全市场排名第 4。富国基金拥有公募、社保、基本养老、年金、专户、QDII、RQFII(通过香港子公司)以及 QFII、基金 投顾 等管 理资 质,是一家全牌照经营的资产管理公司。2022 年,公司获得了证券时报第 17 届“中国基金业明星基金奖”的十大明星基金公司奖。2021 年公 司荣 获 中 国证 券报 第 18 届“金牛奖”等多个奖项。经过 20 多年 的发 展,富国 基金 已 经形成 权益 投资、固定 收益 投资、量化 投资 三大 投研 平台,即“三驾马车”,富国 基金 始终 将投 研 体系建设作为重点工作,目前,三大 平台 各具 特色,发展 愈加 完善,均已 形成 竞争 力强 的品 牌价 值。目前,富国 基金 投研 能力 已覆 盖 主 动权益、固收、量化、养老金投资、FOF 等多个领域,具备多策略、多元化的投资管理能力,全面满足持有人投资理财的需求。富国基金在 ETF 领域有着丰富的产品布局。截至 2023 年 2 月 17 日,富国基金共管理 37 只 ETF,覆盖股票型、债 券型、商品 型、跨境 四大 类,总管 理规 模超 过 400 亿元。在行 业主 题 ETF 中,富国 基金 在科 技、医药 生物、消费、周 期、高端制造、金融地产等多个热门行业板块均有产品布局,ETF 管理 经验丰富。0.00000.20000.40000.60000.80001.00001.2000中证大数据产业指数 富国中证大数据产业ETF金融工程专题报告 敬请参阅最后一页特别声明 13 图表24:富 国 基 金旗 下 ETF 产品分布(单位:只)来源:Wind,国金证券研究所 3.6 基 金 经理 简 介 大数据 ETF(515400)的基金经理为蔡卡尔。蔡卡尔,硕士 研究生,自 2013 年 8 月加入富国基金管理有限公司,历任助理定量研究员、定量研究员、定量基金 经理、量化 投资 部量 化投 资总 监助 理;现任 富国 基金 量化 投资 部量 化投 资副 总监 兼定 量基 金经 理。目前蔡卡尔女士共管理 12 只 基金,其中包括 7 只 ETF、2 只 ETF 联接基金、3 只指数增强 型基金及 1 只普通股票型基金。截至 2022 年12月 31 日,管理规模共计 70.88 亿元。图表25:基 金 经 理在 管基 金一 览(截至2023.02.17)基金代码 基金简称 任职日期 基 金 规 模(亿元)014406.OF 富国中证新华社民族品牌工程联接 A 2022-02-15 0.44 014673.OF 富国中证港股通互联网联接 A 2022-01-11 12.31 159645.OF 富国国证疫苗与生物科技 ETF 2022-09-16 0.37 159748.OF 富国中证沪港深创新药产业 ETF 2021-11-24 1.70 159792.OF 富国中证港股通互联网 ETF 2021-
展开阅读全文