资源描述
1 报告编码19RI0745 头豹研究院 | 金融科技系列概览 400-072-5588 2019 年 大数据技术在中国金融行业的应用概览 报告摘要 金融研究团队 大数据技术在中国金融行业的应用可分为精准营销 类应用、风险控制类应用、监管科技类应用及其他 类型应用。在中国大数据产业整体规模持续扩大的 背景下,由于金融行业与大数据技术的融合效果良 好,在降低企业运营成本及提升企业经营效益等方 面效果明显,金融企业对大数据技术的接受程度不 断提高,带动该应用市场营收规模在 2018 年达到 471.0 亿元。 热点一:分布式数据处理技术水平提升 热点二:金融数据资源丰富,非金融数据资源增加 热点三:中小银行市场进一步拓展 2014 至 2016 年,百度、阿里云及腾讯云先后取得了此 前被雅虎等国际企业包揽的数据排序基准评估大赛 (Sort Benchmark) 中主要子赛项的冠军, 反映了中国企 业在分布式数据处理领域技术水平的提升,支持了大数 据平台实现对流数据的实时计算分析,有利于大数据技 术满足低延时的金融应用场景需求。 金融机构通常会部署多个应用系统,这些系统在日常经 营中持续产生和储存数据,积累了大量高价值的数据。 近年来,中国数据数量呈现爆发式增长态势,来自可穿 戴设备、 GPS、 摄像头等设备以及社交、 电子商务等互联 网应用的各类结构化及非结构化的非金融数据大量产生 并储存。 截至 2019 年 9 月,已有 3 家国有大型商业银行及 6 家 全国性股份制商业银行先后在集团内部组建金融科技公 司,持续加大对大数据应用的投入。未来,大型银行的 大数据应用将多由自身的金融科技公司承接,第三方企 业难以介入。随着中小银行加快对大数据应用的布局, 大数据技术企业有望在中小银行的细分市场进一步进行 业务拓展。 蔡宇宁 邮箱: csleadleo 分析师 行业走势图 相关热点报告 金融科技系列深度研究 2019 年中国金融科技行业深 度报告 金融科技系列概览2019 年中国金融资讯服务行业概 览 宏观政策系列研究报告 2019 年中国金融产业政策分 析概览 1 报告编号19RI0745 目录 1 方法论 . 4 1.1 研究方法 . 4 1.2 名词解释 . 5 2 大数据技术在中国金融行业的应用市场综述 . 7 2.1 大数据技术在中国金融行业的应用定义及分类 . 7 2.2 大数据技术在中国金融行业的应用发展历程 . 9 2.3 大数据技术在中国金融行业的应用产业链 . 11 2.3.1 上游分析 . 12 2.3.2 中游分析 . 15 2.3.3 下游分析 . 16 2.4 大数据技术在中国金融行业的应用市场规模 . 17 3 大数据技术在中国金融行业的应用驱动与制约因素 . 18 3.1 驱动因素 . 1 8 3.1.1 分布式数据处理技术水平提升 . 18 3.1.2 金融数据资源丰富,非金融数据资源增加 . 19 3.1.3 大数据人才供给增加 . 20 4 大数据技术在中国金融行业的应用政策及监管分析 . 21 5 大数据技术在中国金融行业的应用市场趋势 . 23 5.1 中小银行市场进一步拓展 . 23 5.2 大数据流通便捷化,非金融类数据利用率提高 . 25 5.3 多维度风险覆盖,全面支持金融风险控制 . 26 2 报告编号19RI0745 6 大数据技术在中国金融行业的应用竞争格局分析 . 26 6.1 大数据技术在中国金融行业的应用竞争格局概述 . 26 6.2 大数据技术在中国金融行业的应用典型企业分析 . 28 6.2.1 阿里云计算有限公司 . 28 6.2.2 成都数联铭品科技有限公司 . 31 6.2.3 同盾科技有限公司 . 34 3 报告编号19RI0745 图表目录 图 2-1 大数据在中国金融行业的应用分类 . 7 图 2-2 大数据技术在中国金融行业的应用发展历程 . 9 图 2-3 大数据技术在中国金融行业的应用产业链 . 11 图 2-4 大数据技术在中国金融行业的应用市场规模(以销售额计) ,2014-2023 年预 测 . 17 图 3-1 数据排序基准评估大赛专用灰排序冠军,2013-2016 年 . 18 图 3-2 中国数据累计储存量,2014-2018 年 . 20 图 3-3 中国新增备案开设“数据科学与大数据技术”本科专业的高等院校数量, 2015-2018 年 . 20 图 4-1 大数据技术在中国金融行业的应用相关政策 . 21 图 5-1 部分已成立金融科技公司的股份制及国有商业银行 . 24 图 5-2 由中国政府主导的大数据流通模式 . 25 图 6-1 大数据技术在中国金融行业应用市场主要参与者 . 27 图 6-2 阿里云企业概况 . 28 图 6-3 阿里云大数据金融应用产品 . 29 图 6-4 数联铭品企业概况 . 32 图 6-5 数联铭品大数据金融应用产品 . 32 图 6-6 同盾科技企业概况 . 34 图 6-7 同盾科技大数据金融应用产品 . 35 4 报告编号19RI0745 1 方法论 1.1 研究方法 头豹研究院布局中国市场, 深入研究 10 大行业, 54 个垂直行业的市场变化, 已经积累 了近 50 万行业研究样本,完成近 10,000 多个独立的研究咨询项目。 研究院依托中国活跃的经济环境,从信息科技、大数据、金融等领域着手,研究内 容覆盖整个行业的发展周期,伴随着行业中企业的创立,发展,扩张,到企业走向 上市及上市后的成熟期, 研究院的各行业研究员探索和评估行业中多变的产业模式, 企业的商业模式和运营模式,以专业的视野解读行业的沿革。 研究院融合传统与新型的研究方法, 采用自主研发的算法, 结合行业交叉的大数据 技术, 以多元化的调研方法, 挖掘定量数据背后的逻辑, 分析定性内容背后的观点, 客观和真实地阐述行业的现状, 前瞻性地预测行业未来的发展趋势, 在研究院的每 一份研究报告中,完整地呈现行业的过去,现在和未来。 研究院密切关注行业发展最新动向,报告内容及数据会随着行业发展、技术革新、 竞争格局变化、政策法规颁布、市场调研深入,保持不断更新与优化。 研究院秉承匠心研究, 砥砺前行的宗旨, 从战略的角度分析行业, 从执行的层面阅 读行业,为每一个行业的报告阅读者提供值得品鉴的研究报告。 头豹研究院本次研究于 2019 年 10 月完成。 5 报告编号19RI0745 1.2 名词解释 用户画像: 根据用户的基本人口统计学信息及消费、 社交等行为信息为用户构建的标签 化的抽象形象。 关系型数据库:采用关系模型来组织数据的数据库,具体表现形式为行列表格的组合。 结构化数据: 也称行数据, 是具备统一的结构、 能够用行列二维形式表达和管理的数据, 如关系型数据库数据。 非结构化数据:数据结构不规则,不方便用行列二维形式表达的数据,如图片、文本、 音视频等。 社会团体:由公民自愿组成,按照其团体章程开展活动的非营利性社会组织。 GPU:Graphics Processing Unit,图形处理器或图形处理单元,是具有数据运算功能 的电子计算机部件,传统上常用于图形相关的运算工作。 CPU:Central Processing Unit,中央处理器,是具有数据运算功能的电子计算机部 件,是计算机中负责读取、解释并执行指令的核心部件。 分布式数据处理:将数据放在由若干互相联网的计算机组成的计算机网络上进行处 理,与使用单一系统处理数据的集中式数据处理相对。 Hadoop:分布式数据处理的奠基性框架,其主要模块包括用于数据储存的 HDFS (Hadoop Distributed File System)模块、用于数据计算的 MapReduce 模块。 Hadoop 诞生于 2005 年,此后出现的主流分布式数据处理框架大多基于 Hadoop 及 其相关项目构建。 Spark: Spark 是 Hadoop 的相关项目之一, 是一款适用大规模数据处理的计算引擎, 但本身不具备文件管理功能, 需要与其他的分布式文件系统集成才能运作。 与 Hadoop 从硬盘中读取数据不同, Spark 以计算机内存记录及交换数据, 在数据处理速度上具备 6 报告编号19RI0745 优势。 Storm:是一个分布式的实时数据处理框架,与 Spark 同样使用计算机内存进行数据 读写,但比 Spark 更适合于流数据的实时处理。 流数据:随着时间的延续而实时更新的动态数据集合,与已经收集好、不再变动的批 次数据相对。 数据云服务:通过网络以按需、易扩展的方式提供的针对数据的储存、计算等一系列 服务。 ZB:Zettabyte,计算机储存容量单位,中文为泽字节。1 泽字节等于 2 的 70 次方字 节(Byte) 。 7 报告编号19RI0745 2 大数据技术在中国金融行业的应用市场综述 2.1 大数据技术在中国金融行业的应用定义及分类 综合参考中国国家工信部于 2014 年 5 月发布的 大数据白皮书 (2014 年) 以及中国 国家质量监督检验检疫总局、中国国家标准化管理委员会于 2017 年 12 月发布的中国国家 标准GB/T 35295-2017 信息技术 大数据 术语 ,大数据是指具有体量巨大、来源及结 构多样、生成速度快、单位价值密度低、多变等特征,且需要使用非结构化数据库等新型数 据体系结构才能有效处理的数据。 根据应用领域的不同, 大数据技术在中国金融行业的应用可以分为精准营销类应用、 风 险控制类应用、监管科技类应用及其他类型应用(见图 2-1) 。 图 2-1 大数据在中国金融行业的应用分类 来源:头豹研究院编辑整理 (1)精准营销类应用 大数据技术通过以下方式在金融营销业务流程中促进营销转化率的提高及精准营销的 实现: 8 报告编号19RI0745 客户信息整合: 利用大数据平台整合企业内部及外部数据, 形成与客户一一对应的数 据记录。 客户分类:基于用户的行为数据等数据,通过用户画像技术对用户进行标签化分类, 为之后的产品推荐做准备。 客户筛选:基于大数据平台形成客户信用分级名单,按质量对客户进行筛选。 (2)风险控制类应用 大数据技术可在售前风险评估及交易欺诈识别等业务环节促进风险控制有效性及效率 的提升。 售前风险评估: 大数据平台可整合客户的社交、 消费等不同类型的行为数据, 突破中 国金融机构在传统风险控制中仅通过客户信用数据、 历史交易数据等单一维度数据进行售前 风险识别的局限。 交易欺诈识别: 利用大数据技术, 金融企业可将客户的历史位置、 历史行为模式等数 据与当前发生的交易行为数据进行对比, 识别恶意用户及欺诈行为, 并在后续采取相应处理 措施。 (3)监管科技类应用 大数据技术可在违规风险预警等业务环节协助金融企业识别违法违规行为。 利用大数据平台,金融企业可以从资金、企业的双重角度,对金融企业的资金链、违规 记录、 网络投诉率等维度的数据进行综合分析, 从而定位洗钱、 非法集资等潜在违法违规行 为风险,并向有关监管部门上报。 (4)其他类型应用 除了以上三类应用外, 目前在中国金融行业已实现商业化的大数据技术应用以智能投资 顾问为主。 9 报告编号19RI0745 智能投资顾问产品的核心技术包括大数据及人工智能技术等, 其中大数据技术用于通过 用户的交易行为等个性化数据识别用户的风险偏好及其变化规律, 便于后续提供个性化的资 产配置方案。 2.2 大数据技术在中国金融行业的应用发展历程 大数据技术起源于 2000 年前后的互联网产业,后于 2011 年作为独立概念被提出并受 到广泛关注。中国是积极布局大数据技术研究及其应用的国家之一,自 2010 年以来,大数 据技术在中国金融行业的应用经历了萌芽期、起步期两个阶段(见图 2-2) 。 图 2-2 大数据技术在中国金融行业的应用发展历程 来源:头豹研究院编辑整理 (1)萌芽期(2010-2013 年) 2010 年,中信银行开启了中国主流金融机构对大数据技术应用的探索。在信用卡发行 量及业务数据量迅猛增长的背景下,中信银行信用卡中心于 2010 年 4 月启用了来自 Greenplum 公司的数据仓库解决方案。基于该数据仓库,中信银行信用卡中心可从交易、 服务、 风险、 权益等维度积累及分析客户数据, 并根据银行整体营销策略为客户提供更有针 对性及更快速的营销服务。该案例具备了将大数据技术应用于精准营销业务的应用雏形。 10 报告编号19RI0745 2011 年 11 月,中国国家工信部发布了物联网十二五规划 ,其中将信息处理技术列 为四项关键技术创新工程之一。 物联网十二五规划提出重点发展的信息处理技术中包含 海量信息的储存及处理、 数据挖掘等技术, 即大数据技术的重要组成, 物联网十二五规划 的出台从政策层面促进了大数据技术在中国的起步发展。 (2)起步期(2014 年至今) 2014年3月, 2014 年国务院政府工作报告中首次提出要设立新兴产业创业创新平 台,在新一代移动通信、集成电路、大数据等方面赶超先进国家,引领未来产业发展。 大数据首次被写入国家政府工作报告, 引发了中国各界对大数据技术的关注, 数据流通 与交易、 政府数据开放等概念逐渐普及。 同时, 各级地方政府开始积极出台政策推动大数据 技术及其应用的发展, 如武汉市政府于 2014 年 7 月印发的 武汉市大数据产业发展行动计 划(2014-2018 年) 。 在 2014 年前后,中国大数据产业生态开始建立,一批本土 IT 厂商推出了基于大数据 技术的产品,例如华为推出的“OceanStor N9000”企业大数据储存产品。在金融行业, 大数据技术率先在小额贷款领域取得突破。 阿里巴巴、 京东等电子商务企业将传统的信用审 核流程与自有的电商交易数据结合,将大数据技术应用于贷款发放的风险控制上,推出了 “阿里小贷” 、 “京东京小贷”等产品。 2015 年 10 月,中国共产党第十八届中央委员会第五次全体会议的决议公报中正式提 出要实施国家大数据战略, 推进数据资源开放共享。 这是大数据技术第一次写入中国共产党 的全会决议, 标志着大数据战略正式上升为国家战略, 推动了大数据产业及行业融合应用的 加速发展。 2016 年前后,大数据技术在保险领域的应用出现显著发展,部分中国保险企业开始将 大数据技术融入保险产品的更新升级中, 如众安在线财产保险股份有限公司通过对接淘宝用 11 报告编号19RI0745 户的数据信息并进行数据分析及挖掘, 推出了可对不同用户提供不同报价, 且具备精准定价 功能的退货运费险。 安心财产保险有限责任公司则通过智能手机客户端获取车主驾驶行为数 据,并结合车主个人信用数据、违章历史数据、车型等维度信息,从“人” 、 “车” 、 “用车” 三个角度来对车险产品进行定价。 2018 年,大数据技术在中国金融行业的应用渗透率进一步提高,在金融反欺诈、客户 关系管理、 智能投资顾问等领域已出现较多应用产品, 代表性产品有北京明略软件系统有限 公司为中国交通银行信用卡中心设计的“实时反欺诈监控交易系统” 、恒丰银行股份有限公 司自主研发的新型 CRM 系统、北京金信网银金融信息服务有限公司推出的“大数据监测预 警金融风险平台” 、浙商基金管理公司与通联支付网络服务股份有限公司合作推出的浙商大 数据智选消费基金等。 2.3 大数据技术在中国金融行业的应用产业链 大数据技术在中国金融行业的应用产业链由上游金融应用大数据提供者及大数据基础 设施提供商、 中游大数据金融应用提供商、 下游大数据金融应用使用者四大类主体构成 (见 图 2-3) 。 图 2-3 大数据技术在中国金融行业的应用产业链 12 报告编号19RI0745 来源:公司官网,头豹研究院编辑整理 2.3.1 上游分析 2.3.1.1 金融应用大数据提供者 金融应用大数据提供者为大数据技术在金融行业的应用提供原始数据, 是大数据金融应 用产业链上游环节的第一类参与主体。 依据机构类型, 中国的金融应用大数据提供者可以分 为商业企业、社会团体、政府部门等。 (1)商业企业 金融行业大数据提供企业不仅限于金融企业本身, 还包括征信企业、 互联网企业、 电信 企业等主要大数据来源。 金融企业 根据中国国家监管要求, 个人参与存贷、 投资等个人金融交易均需进行实名制认证, 故 金融企业通常能掌握到个人客户的真实身份信息、 年龄、 在企业的历史交易信息等, 此类在 移动端(手机应用、微信及支付宝小程序等)有布局的金融企业还能掌握客户的位置信息。 13 报告编号19RI0745 金融企业中, 银行对客户的金融数据尤其是资产数据掌握最为全面, 可针对客户的财务 状况及金融行为作出较为精确的客户画像。 征信企业 个人及企业客户的信用数据是金融行业决策参考的主要数据类型之一, 例如个人信用数 据在消费金融类业务的产品定价及风险控制环节中均具有重要参考价值。 中国的征信体系在 现阶段以政府部门(中国人民银行)为主导,由征信企业作为补充,其中包括政府部门主导 设立的信用信息服务企业及民营社会征信企业等。 个人信用信息方面, 由中国人民银行及上海市政府支持设立的上海资信有限公司拥有积 累多年的基础金融信用数据, 具有互联网背景的私营个人征信公司则在用户社交信息方面较 有优势,如阿里巴巴旗下的芝麻信用管理有限公司。 企业信用信息方面, 具有政府背景的征信企业如鹏元征信有限公司拥有政府及其他社会 部门、商业银行的数据源,优势明显。 互联网企业 在全民上网的时代, 互联网企业通过用户的网络行为可对用户的职业、 兴趣爱好、 社交 等重要属性进行画像绘制。 互联网企业中, 具有电子商务业务布局的企业如阿里巴巴等, 掌握大量关于用户消费金 额及消费行为的数据,该类数据可与消费贷款等互联网金融业务形成直接联系。 电信企业 电信运营商对个人及企业用户拥有多年的电信数据积累, 数据库类型包括用户的终端信 息、位置信息、通话行为、上网行为等数据,可以对用户的上网及消费行为特征画像起到辅 助性作用。 (2)社会团体 14 报告编号19RI0745 根据中国民政部数据, 中国现有社会团体超过 36.1 万家, 其中行业协会及商会超过 10.2 万家,是社会团体中主要的大数据提供者,可提供行业统计数据等以企业为主体的数据。 行业协会及商会中, 部分全国性机构过去由相关行政部门主办、 主管或挂靠在行政部门, 在数据资源获取及储备上具备较大优势, 如中国交通运输协会、 中国民办教育协会、 中国互 联网协会等。 (3)政府部门 中国政府的金融主管部门、工商、行政、司法等部门均拥有大量的非结构化数据,代表 性部门有中国人民银行。 中国人民银行征信中心(以下简称“人行征信中心” )是现阶段中国居民个人及企业信 用数据的主要提供者。 个人信用数据方面,由人行征信中心出具的个人信用报告中,有全面的政府系统信息, 包括贷款记录、信用卡信息(开立、注销、消费额度等) 、欠税记录、强制执行记录、民事 判决记录、行政处罚记录等。 企业信用数据方面, 人行征信中心拥有现中国国内最大的企业信用信息基础数据库, 接 入了商业银行、信托公司、小额贷款公司、财务公司等贷款机构数据,出具的企业信用报告 内容包括企业的借贷信息、欠税信息、行政处罚信息、法院判决和执行信息等,可以全面地 展示企业的经济状况。 2.3.1.2 大数据基础设施提供商 大数据基础设施提供商为大数据技术在金融行业的应用提供基础硬件产品、 数据处理框 架及数据处理资源,是大数据金融应用产业链上游环节的第二类参与主体。 (1)大数据基础硬件提供商 15 报告编号19RI0745 大数据基础硬件提供商提供大数据采集、传输、储存等技术环节所需的硬件设备产品, 如智能终端、计算机硬盘、计算机芯片(包括 CPU、GPU 等)等,其中与传统数据技术需 求不同的硬件提供商主要为 GPU 提供商。 近年来,随着运算速度的提升及可编程性的发展,GPU 的应用已经由传统的图像渲染 工作扩展到各类快速计算任务,在大数据技术领域比 CPU 更加常用,代表性厂商包括超微 半导体公司(Advanced Micro Devices, Inc.)及英伟达公司(NVIDIA Corporation) 。 (2)大数据处理框架提供商 大数据处理框架提供商为大数据应用的实现搭建平台、 提供相关技术支持。 由于大数据 具有数据体量巨大的特征, 传统的以单计算机为基础的数据处理框架难以在短时间内完成大 规模数据的处理,从而支持大数据金融应用的及时实现。因此,在大数据系统中,通常对数 据采用分布式处理,常用的处理框架包括 Hadoop、Spark、Storm 等。 Hadoop、Spark 及 Storm 均为免费开源软件,现由阿帕奇软件基金会(Apache Software Foundation)进行管理。 (3)大数据处理资源提供商 大数据处理除了需要在框架的基础上进行外, 还离不开数据处理资源对数据存储及计算 的支持。 在大数据系统中, 常用的数据处理资源来自于数据云服务提供商, 代表性企业有阿 里云计算有限公司 (以下简称 “阿里云” ) 、 腾讯云计算 (北京) 有限责任公司 (以下简称 “腾 讯云” ) 。 2.3.2 中游分析 大数据技术在中国金融行业应用产业链中游环节的市场参与者为大数据金融应用提供 商,通过提供大数据金融应用工具、提供大数据金融应用解决方案两类商业模式开展业务: 16 报告编号19RI0745 (1)大数据金融应用工具提供模式:大数据金融应用提供商仅提供应用工具给下游大 数据金融应用使用者,而不进一步提供大数据服务; (2)大数据金融应用解决方案提供模式:在大数据应用工具的基础上,通过大数据专 业人员提供的服务,为应用使用者提供直接应用于金融业务的一套完整的解决方案。 在大数据金融应用工具提供模式中, 大数据金融应用提供商以软硬件形式将具备大数据 查询、储存、计算分析、报告输出、可视化等基础模块化功能的应用工具提供给使用者,由 使用者直接或在进一步自主定制的基础上使用工具。 由于操作及进一步深度定制大数据应用 工具需要一定的信息技术知识,具备自主使用大数据应用工具能力的金融企业数量相对较 少。以证券公司为例,在头豹研究院的调研中,行业专家表示在中国现有 131 家证券公司 中,仅有规模排名前 10%的大型证券公司具备相关大数据技术能力。在下游金融企业技术 水平有限的情况下, 金融企业更倾向于直接购买大数据金融应用解决方案, 仅提供应用工具 的商业模式逐渐弱化。 2.3.3 下游分析 大数据技术在中国金融行业应用的产业链下游环节涉及大数据金融应用产品及服务的 使用者,即金融企业。 在互联网金融模式的冲击下, 中国金融行业竞争程度不断提高, 行业运作方式正在重构, 金融企业对基于数据挖掘及分析的精细化运营的重视程度不断提高, 对大数据技术应用的需 求日益明确。 金融企业中, 互联网金融企业拥有丰富的用户场景数据及较强的金融科技自主 开发能力,议价地位强势。 17 报告编号19RI0745 2.4 大数据技术在中国金融行业的应用市场规模 在全球经济数字化发展浪潮下, 受到宏观政策支持力度加大、 大数据标准化体系逐步完 善、 数字应用普及率提高、 大数据相关技术进步与升级等众多利好因素的影响, 中国大数据 产业整体规模在过去 5 年中持续扩大。 在大数据技术与行业的融合应用中, 金融行业是传统上及当前主要的应用行业之一, 行 业应用占比排名长期保持在前三,目前达到约 15%。由于金融行业与大数据技术的融合效 果良好, 在降低企业运营成本及提升企业经营效益等方面容易见效, 金融企业对大数据技术 的接受程度不断提高, 带动该应用市场销售规模由 2014 年的 148.4 亿元提高至 2018 年的 471.0 亿元,年增长率达到 33.5%(见图 2-4) 。 图 2-4 大数据技术在中国金融行业的应用市场规模(以销售额计) ,2014-2023 年预测 来
展开阅读全文