资源描述
中国数据人才供需关系和培养报告前 言2自 2016年国家 第一次新增 “ 数据科学与大数据技术 ” 专业起 , 2020年底已 有近 2000所高校开设相关专业 。 尽管经过了 5年的系统性 数据 人才建设 , 然而数据人才的缺口 依然呈现上升状态 。 并且 随着大数据相关 产业不断 调整升级 , 人才教育培养 目标 和人才市场需求之间形成了 一定的 偏差 。 因此 , 无论是企业还是高校 , 都需要对照新的数据人才发展形势 , 重新梳理供需关系 , 做好数据人才培养任务 。为此 , 帆软数据应用 研究院在对 900余家企业数据人才招聘 需求进行调研和对众多 院校相关老师进行 访谈的基础上 ,形成本报告 。 报告从供不应求的数据人才现状为出发点 , 围绕就业和培养进行详细探究 , 并给出高校和企业关于数据人才培养的行动 指南 , 希望对我国高校 和 企业的数据人才培养工作提供参考 。主要结论 数据人才培养出现一定的教育偏差 , 学生 数据思维能力 的提升是重中之重 。 数据能力将是未来求职者的重要基本素质 。 企业 应鼓励 IT人员提升数据思维能力 , 并从提升数据质量出发 , 培养企业数据文化底蕴 。目 录01 供不应求的数据人才02 数据人才就业现状03 数据人才培养现状04 行动指南数据时代下 , 数据应用的价值已经展露在各行各业中 , 数据 人才 供不应求也 是老生常谈的 话题 。 相关 数据表明 , 未来一段时间内 , 数据人才缺口还会保持在每年 40%左右的增幅 , 且数据岗位 呈现多元化发展 。另外 , 在 “ 新冠 ” 疫情期间 , 防疫抗疫的 各个角落都 有数据应用的影子 , 例如:健康码 , 疫情上报 , 疫情数据可视化播报等 。 随后出台的 “ 新基建 ” 政策 , 给出大数据产业的发展导向 , 促进了大数据产业规范性发展 , 再次加大了数据人才的缺口 。本节我们围绕数据 人才缺口 、 行业 未来发展 以及主流行业对 数据 人才的需求等方面进行 探究 , 梳理数据 人才的整体现状 。01 供不应求的数据人才数据下的 “ 供不应求 ” 谁做了催化剂? 主流行业的现状数据下的 “ 供不应求 ”数据行业 GDP增速超 30%,是软件行业的 2倍 左右。国家统计局数据显示 , 数据行业自 2016年以来 , 其 GDP增速 是国家 GDP增速的 4倍左右 , 约是软件行业 2倍 , 并 有望在 2020年突破 10000亿 元 。 并且 未来 5-10年内 , 数据行业的产值 增度 将 会维持 在一个较 高水平上 。542848482325510361909717682940 3700 48006170 808012.60%14.20%12.40%15.90%25.90%29.70%28.50%30.90%00.050.10.150.20.250.30.35010000200003000040000500006000070000800002015 2016 2017 2018 20192015-2019年数据行业 与 软件行业 GDP对比软件行业产值 数据行业产值 软件行业增速 数据行业增速数据来源: 国家统计局,前 瞻产业研究院数据下的 “ 供不应求 ”数据人才缺口预计在 2022年 达到 300万人 , 并且 人才 组成呈多元化 。软件行业和数据行业是两个人才来源相近的行业 , 大多数人员来自 于计算机 , 软件等理工科专业 。 在大数据行业发展前期 , 其主要从业人员来自于软件行业 。 由于软件 行业和数据 行业两者存在总体 薪资 水平与人均 产值接近的 特性 , 我们根据软件 行业从业 数据预测 2020年从事数据 行业的人员约为 78万 。根据 LinkedIn、 赛迪智库 、 拉勾 网 等机构的统计结果 , 大数据时代下 的 数据人才总体缺口呈现加剧增长状态 。 近 3年 ,数据人才缺口在以每年 50万人 增加 。 预计 在 2022年 , 相关大数据专业高校毕业生大规模进入就业后 , 整体缺口增速才 会 有所 放缓 , 但 这一 缺口 仍会长期存在 。导致缺口人数大于实际产值人数 的 可能 原因 有两点 。 一 是大数据应用 更多 地 是 和产业结合 , 其产值和人员不归属本行业;二是大数据人员不仅仅指专业数据技术人员 , 还 包含 和产业相结合的人才 , 未来其人才组成会呈现多元化发展 。6554 576598645 67344 46 49 56 6530 456810515001002003004005006007008002015 2016 2017 2018 20192015-2019年软件和数据行业从业人员情况软件行业数据行业大数据未来缺口人员单位:万44 46 4956653045681051500204060801001201401602015 2016 2017 2018 20192015-2019年数据行业从业和缺口人员情况从业人员缺口人员单位:万谁做了催化剂 ?疫情和相关政策进一步扩大 了企业对于数据 人才的 需求量。从历年的数据产业 GDP占比和增速来看 , 在 “ 后疫情时代 ” 中 , 国内对于数据利用有了新的认知 , 无论 是基层 网格的数据采集工作 , 还是 每日疫情 播报中的直观数据可视化效果 , 都 对各个行业产生了潜移默化 的影响 , 可以说疫情 加速了大众对于 数据利用的了解 和认知 。同时 , 从国家 颁布的大 数据政策数量可以看出国家对数据建设的重视程度 。 今年出台的 “ 新基建 ” 和 “ 十四五规划 ”中 , 也把数据应用作为一个 重要的建设任务 。 国家政策在为 数据产业 保驾护航的同时 , 也 进一步 加大了相关 产业对于数据人才的 需求 。71210924024681012142016 2017 2018 2019 20202016-2020年国家级大数据政策数量统计数据来源:赛迪顾问主流行业的现状互联网和工业行业对于数据人才的需求量 居高不下。2020年大数据生态联盟调查数据显示 , 当前 数据人才需求集中在互联网行业 , 但是工业行业的需求量反超金融行业上升至第二 , 占比 11.30%。 我们从这两 个主流 行业入手来分析数据 人才稀缺的原因 。互联网行业是数据利用最深入的行业 , 无论是用户画像 、 个性 推荐还是海量数据处理 , 都是无处不在的数据应用 , 其诞生之际便拥有着数据基因 。 近年来 , 数据产品经理 , 用户数据分析师等岗位的新兴 ,也意味着互联网行业从原来的数据技术人才开始往数据业务人才扩展 , 促进企业全面化的数据应用 。工业行业相比于互联网行业 , 其数据利用成熟度很低 。 但由于近年来人力成本提升 , 市场竞争加剧等原因 , 传统企业纷纷进行数字化转型 , 希望可以利用数据达到 “ 降本增效 ” 和 “ 精细化管理 ” 的目标 ,进一步提升竞争力 。 但是由于传统企业自身的人员结构的特殊性 , 其数据人才的缺失率比其他行业偏高很多 。8互联网57%工业11%通信10%金融8%医疗健康4%消费品3%文教2%房地产1% 其他 4%2020年各个行业数据人才缺口占比互联网工业通信金融医疗健康消费品文教房地产其他在研究了数十 所 院校开设的 认知 实习课程后 , 我们发现 数据行业对于学生或者初学者来说 , 还是一个新兴且未知的领域 , 大量学生对数据行业的岗位 分布和具体 职责存有 一定的疑惑 。 本节将 从数据人才的 组成 、数据 应用全景图和就业岗位要求三个方面解释数据人才的就业现状 , 帮助学生 和初学者 对建立对数据 人才的初步了解 。02数据人才就业现状数据人才的组成 数据应用全景图 数据人才就业岗位要求数据人才的组成当前 数据 人才主要由 数据技能类和数据文化类共同 组成。10大 数据属于一个基础技术范畴 , 需要 和其他行业做应用结合 , 例如金融 大数据 , 工业大数据 等 。 所以 从单一行业来判断数据人才的组成有所误差 , 应当以技能为着眼点来判定 。 目前关于数据人才的组成 , 从 技能 上主要分为 数据技能类和数据文化类 。数据技能类:即以大数据相关技术为主要核心工作技能的人员 , 例如:大数据开发工程师 , ETL工程师 , 算法工程师和 AI工程师 等 。数据文化类 :指 拥有数据思维和数据意识的业务人员或者非强技术人员 , 以业务能力为主 , 数据基础能力为辅的人群和岗位 , 例如:大数据财务分析师 , 市场分析师等 。前者侧重于大数据技术 , 后者侧重于业务 思考 , 但两者 对于大数据基础 能力都 有着较强的要求 。 随着 数字化进程的加快 , 很多 岗位的工作 内容 将会 被重新 定义 , 后者的缺口也将进一步被放大 。数据技能类 数据文化类指日常工作以岗位知识为主 , 但需要拥有数据能力和数据思维的新兴复合型人才 , 其岗位有:大数据财务分析师 , 数据产品经理 , 市场分析师等 。指从数据采集 , 数据存储 , 数据治理 , 数据挖掘 ,数据可视化 , 数据分析全链路的一个数据应用过程 ,其就业岗位有:数据分析师 , ETL工程师 , 数据仓库工程师 , 大数据开发工程师等 。数据应用全景图数据技能类人才和数据文化类人才在数据应用中 缺一不可。11利用数据的过程 中 , 由 数据技能类人才进行数据设计层工作 , 搭建数据服务层中相关大数据应用平台 , 以供数据应用层中的数据文化类人才使用 , 加强数据应用的范围和深度 。 两类人才缺一不可 , 由双方共同优化数据应用体系才能 让数据真正成为生产力 。数据采集 数据存储 数据处理 数据挖掘 数据可视化 数据分析大数据应用平台财务 销售运营 市场等数据能力数据设计层数据服务层数据应用层数据人才就业岗位要求数据技能类岗位主要以数据库为基础,互有关联,但各自 千秋。12从数据采集到数据分析全流程链路中 , 每个技能都代表相关岗位 , 类如:数据采集工程师 , ETL工程师等等 , 但是由于数据链路是互通的 , 所以其就业岗位对以上 6个方面的技能或多或少有所涉及 , 而数据库应用则为基础能力 。数据存储数据可视化 熟悉 Web前端技术, D3、 Echarts、 Three.js、 WebGL等开源数据可视化库和技术 熟悉 FineReport, FineBI等商用可视化工具 掌握计算机图形学理论基础,数据可视化相关基础算法 熟悉 hadoop环境下的大数据开发;数据库应用; 熟悉有高性能网络软件开发,熟悉 TCP/IP网络协议栈及相关网络开发框架数据挖掘 熟悉 linux操作,熟悉 oracle数据库及 sql语言 python或者 R语言 掌握数据分析 /挖掘方法及相关 算法数据采集 熟练 python语言,基础前端知识,数据库应用 精通网页抓取原理及技术,熟练使用正则表达式数据处理 数据分析 熟悉 python, R等语言,统计学基本知识 拥有业务结合能力 熟悉数据库 应用 熟悉 ETL工具,熟悉 python 熟悉数据仓库搭建和数据库应用数据人才就业岗位要求数据文化类岗位要求员工用数据思维去解决业务问题并优化解决 方式。目前数据文化类岗位的职能和 销售 、 财务 、 人事 、 运营 、 市场 等 岗位一致 。 但在数据 时代下 , 其工作内容 发生了部分改变 。 例如在 大数据量下 , Excel处理速度较慢且展现单一 , 财务人员可以利用 BI工具进行快速处理 , 提升效率且展示更加直观 , 让其有更多的时间去分析解决业务上的问题 。当然数据文化类岗位不仅仅是简单的把业务能力和数据能力累加在一起 , 而是一个递进的关系 , 真正的数据人才是可以给企业带来业务上的优化 和增值 , 能够为企业创造 巨大价值 的人员 。13 业务知识 岗位要求业务能力 大数据技能和工具 数据分析思维数据能力 优化业务 业务增值创造价值在 供不应求的人才现状下 , 数据 产业业 态处于多变的阶段 , 人才培养 方案的制定 和 更新无疑 是高校的巨大压力 。 因为 教育不能重来 , 高校需要对每个学生负责 。 本节将对比高校 培养现状和企业用人 标准 , 找出其存在的差异点 。此外 , 在 数据人才严重供不应求的情况下 , 在内部培养数据人 才是企业 获取数据人才的重要路径 , 本节也会针对不同等级的企业 分析其培养难点 。03数据人才培养现状高校 培养现状 企业 培养现状高校 培养现状数据技能类人才 培养方案和 就业需求略有差异,需要进一步优化培养 侧重点。目前近 2000所 高校 已经 开设大数据相关 专业 , 其中本科院校仅有 3所 。 64所专科 院校相关专业的第一届毕业生 , 就业受到疫情 影响 , 教学情况不易衡量 。 分析北京大学 、 对外经济贸易大学 、 金陵 科技 学院 、 常州 信息职业技术学院等200所高校的培养 方案 , 其专业课程主要偏向计算机专业基本课程以及 python语言程序设计 、 Linux操作系统 、 大 数据 可视化 、 Hadoop平台等 , 虽然与前文 就业方向 类似 , 但 存在一定的差异 , 具体体现如下: 高校 教育具有 前瞻性:这 是高校教学的一个特性 , 高校教育往往会进行教学前瞻 , 因此会和就业有所差异; 方案一致性:从 双一流到专科院校 , 人才培养方案无过多差异性 , 从学校属性和人才定位上有所不妥; 教学 的多样化 :高校教学以数据 全 流程为主 , 但是侧重点 有误差 , 数据分析过多 , 而数据处理内容欠缺 。153 352854886260 0 5 30790 642767361355020040060080010001200140016002016 2017 2018 2019 20202016-2020年大数据相关专业开设数量数据科学与大数据技术 大数据管理与应用 大数据技术与应用76%76%78%86%90%96%98%99%99%99%人工智能数据仓库商务智能Hadoop平台大数据可视化Linux操作系统JAVA程序设计python语言程序设计数据结构计算机网络专业课提及率 TOP10数据来源:帆软数据应用研究院整理 数据来源:帆软数据应用研究院整理高校 培养现状数据文化类人才培养发展 迅速,初见成效。数据显示 , 63%的院校在 “ 新商科 ” 和 “ 新文科 ” 专业 中设置了数据相关 课程 , 无论是清华大学开展的大数据 +金融联合 招生 , 还是大多高职 院校在专业 群建设中把 “ 数据分析 ” 纳入 通识课程 , 都表明 “ 新商 科 ” 、 “ 新文科 ” 等专业在积极和时代就业要求相接轨 , 促进学生数据能力提升 。目前 “ 新商科 ” 、 “ 新文科 ” 的转型重点是确保 未来的学生 可以以 “ 解决问题 ” 为核心点 , 结合目前数据时代 下的业务和事物改变 , 充分利用数据思维能力来 有效地解决问题 , 并能够作出归纳总结 , 形成个人的 数据素养 , 为数据应用进一步落地做准备 。16转型高校63%未转型高校37%“新商科”和“新文科”数字化融合高校占比转型高校未转型高校企业 培养现状没有良好的数据带头人,数据人才培养将会陷入 停滞不前。企业在数字应用过程中一般会经历四个阶段:沉睡 阶段 、 起步阶段 、 发展阶段 和成熟阶段 。 根据帆软数据应用研究院在 2018-2020年期间对企业 数字化 转型的调研数据得知 , 当前 36.63%的受访企业 仍处于沉睡阶段和起步阶段 , 主要原因为企业数据质量 较差 、 数据 人才 稀缺 、 没有 数据文化 氛围等 。就四个 阶段的要求 和定义 来看 , 成熟 阶段企业拥有独立的业务数据应用产品 , 其业务人员的数据思维较高 , 且企业具有浓厚的数据文化氛围 。 企业从沉睡阶段到成熟阶段 , 需要 IT部门首先站 出来 , 加快企业数据质量的优化 , 随后进行业务 部门数据 意识的培养 , 从而逐步形成企业的数据文化 , 共同 促成让 数据成为生产力的良好局面 。1712.21%24.43%43.51%19.85%沉睡阶段起步阶段发展阶段成熟阶段企业数字化应用四个阶段占比情况沉睡阶段 基础统计 完全以 Excel来工作 眼中只有 Excel 兼职,手工处理 Excel起步阶段 数据报表,简单报告 以 Excel为主,数据库为辅 Excel满天飞 少量专职人员发展阶段 汇总分析,专题分析 以数据库为主,开始建设数据仓库 业务人员依赖数据报表 数据分析团队成熟阶段 数据门户,业务数据应用产品 大数据平台,各类数据组件 业务场景对应不同数据产品和模块 大数据中心企业数据发展阶段鉴于当前数据人才供需 不平衡 , 就业和培养存在 差异 , 我们在 本节 中将从 高校和企业两个角度 去给出数据人才培养建议 , 希望能为数据 人才 缺口问题和企业数据文化建设提供参考 。04行动指南高校 数据 人才培养 企业 数据 人才培养高校数据人才培养解决当下就业矛盾,培养学生自主学习 能力。在技术更新换代频繁的年代 , 因为高校的培养周期较长 , 往往导致高校教学内容和就业要求存在一定的差异 。 而岗位和职业也会受到 技术革新的影响而新增 或消失 , 所以国家一直在完善成人教育体系 , 为未来岗位变革引发的失业人群做二次就业支撑 。 这点也表明目前高职院校和应用型本科 应当以解决当下的就业矛盾问题为主 , 积极和产业合作 , 培养出 更多填补当前 就业缺口的人才 。另外 , 就 目前知识付费市场的规模来看 , 未来会有更多人员为知识进行付费学习 。 自我学习能力也就决定了学生成长的天花板 。 自我学习能力需要 长期培养才可以 达到 , 而 高校正符合这种长周期培养 的要求 。 相对 于基本技术而言 , 培养学生自主学习能力也是未来教育的一大重点 。1949.686.3154.2237.30 50 100 150 200 25020172018201920202017-2020年知识付费行业产值(亿元)0.430.921.872.923.874.1200.511.522.533.544.52015 2016 2017 2018 2019 20202015-2020年中国知识付费用户规模(亿)企业数据人才培养企业数据人才的培养需 从 IT人员入手,不断完善 基础数据 ,并促使 业务 人员参与数据分析。帆软数据应用研究院在 2020企业数据生产力调研报告 中指出 , 企业 数据应用良好的主要原因 有数据质量高 、 数据 平台使用活跃 和数据团队专业能力较强等 。与前文 企业数据应用四个 阶段的发展过程相似 , 企业数据人才的 培养 , 应从 IT人员的数据意识和能力开始 , 从技术角度提升企业数据质量 , 进而促进业务人员参与数据分析 , 参与改进 数据质量 , 参与研究 业务分析模型 , 最终达到双方协同优化数据应用的结果 。2064.28%57.14%71.43%数据质量较高平台使用活跃团队数据能力较高数据应用良好原因各自成长比例
展开阅读全文