资源描述
02顾问魏凯 邱跃鹏 谢呼 王慧星 吴运声 李佳中国信息通信研究院曹峰 刘硕 梅舒欢腾讯云产品部曾璇 王小叶 晏栋 丁小俊 王磊 施明 吴述雷 彭碧发 边雅洁腾讯安全战略研究部李南 刘鑫 翟尤 王京婕 张娜 管洪博 秦天雄 陈亮 刘巧霞李俊杰 赵玉现 赵子飞 周杨 任禹臣 shermanlv 侯文兴腾讯优图实验室刘皓 任博 姜德强 刘银松 费先江 郭安泰 吴磊杨阳 胡益清 蒋兴华智能文字识别能力评测与应用白皮书03中国信息通信研究院腾讯云 AI 计算机视觉中心中国人工智能产业发展联盟中国信息通信研究院是工业和信息化部直属科研事业单位,多年来在行业发展的重大战略、规划、政策、标准和测试认证等方面发挥了有力支撑作用,为我国通信业跨越式发展和信息技术产业创新壮大起到了重要推动作用。近年来,围绕国家“网络强国”和“制造强国”新战略,中国信息通信研究院在 4G/5G、工业互联网、云计算、大数据、人工智能、网络与信息安全等方面进行了深入研究与前瞻布局,在国家信息通信及信息化与工业化融合领域的战略和政策研究、技术创新、产业发展、安全保障等方面发挥了重要作用。腾讯云 AI 计算机视觉中心是腾讯 AI 技术落地的商业化产品中心,依托腾讯三大顶级人工智能实验室,打造全球领先的智能云平台及丰富的 AI 应用,涵盖人脸人体识别、文字识别、图像识别等多个领域。凭借全球领先的技术和创新方案,腾讯云 AI 视觉中心携手生态合作伙伴,帮助客户在“云 +AI”的产业互联网浪潮中,快速实现数字化和智能化的转型,助力数字中国建设。为进一步落实“互联网 +”人工智能三年行动实施方案提出的关于组建人工智能产业联盟,搭建政产学研用合作平台,构建我国人工智能产业生态的相关要求,在国家发展和改革委员会、科学技术部、工业和信息化部、中央网信办等部门的指导和支持下,中国信息通信研究院牵头会同相关单位,共同发起成立中国人工智能产业发展联盟。目前,联盟已发布了多项研究成果,先后主办、承办多次会议、高峰论坛,组织开展了 AIIA 杯人工智能巡回赛,出版人工智能技术与应用案例征集等,为政府决策、产业发展提供支撑。04腾讯优图腾讯云腾讯优图实验室成立于 2012 年,是腾讯公司旗下顶级人工智能实验室。优图聚焦计算机视觉,专注人脸识别、图像识别、OCR 等领域开展技术研发和行业落地,在推动产业数字化升级过程中,优图始终专注基础研究、产业落地两条腿走路的发展战略,与腾讯云与智慧产业深度融合,挖掘客户痛点,切实为行业降本增效。与此同时,优图关注科技的社会价值,践行科技向善理念,致力于通过视觉 AI 技术解决社会问题,帮助弱势群体。腾讯倾力打造的云服务品牌,为客户提供领先的云产品与云服务。依托遍布全球的数据中心,腾讯云将云计算、大数据、人工智能、物联网、安全等先进技术与智慧产业业务场景相结合,同时面向金融、教育、医疗、零售、工业、交通、能源、广电等领域,打造全面的智慧行业解决方案。目前,腾讯云已在互联网行业的电商、视频、生活服务方向取得明显优势地位,中国最优秀的互联网企业大部分选择腾讯云作为云服务商,同时服务包括中国银行、建设银行、中国人保、国家电网、中国商飞、中粮集团等优秀的企业,帮助他们实现数字化和智慧化产业升级。腾讯安全战略研究部腾讯安全战略研究部,以实施产业互联网安全战略、培育网络安全新生态为己任,致力网络安全战略规划,跟踪网络安全政策法规,聚焦数字空间生态治理,护航互联网产业健康发展。在 5G、AI、工业互联网等领域开展产业研究和安全赋能。携手合作伙伴,腾讯云致力于打造丰富、开放的云服务生态,驱动各行各业数字化转型升级,实现“产业智变,云启未来”的美好愿景。05智能文字识别能力评测与应用白皮书当前,以人工智能、大数据、区块链、云计算等为代表的新一代信息技术革命浪潮席卷全球,加速社会生产和生活迈向智能化阶段。光学字符识别(OCR,Optical Character Recognition)技术自十九世纪七十年代初次登上历史舞台以来,技术路径不断创新、应用场景逐渐丰富,已经成为人工智能领域的重要分支。今年 4 月,国家发改委首次明确将人工智能等新技术基础设施列入“新基建”范围,作为人工智能商业应用最为成熟的领域之一,OCR 在“新基建”战略背景下无疑将迎来新的发展机遇,相关技术也将迎来新一轮的爆发。这些国家层面的政策布局加速了人工智能产业的不断成熟,推动了 OCR 技术在金融、政府、物流、医疗、教育等多个领域的广泛应用。OCR 也被称为最“接地气”的人工智能技术,它能将图片中的文字快速转化成文本,原来需要人工逐个识别和录入的场景,现在可以通过OCR技术自动化提取,从而有效地降本增效,节省人力。但在实际应用中,缺乏一个有效的标准去衡量OCR技术在不同场景中的优劣差异。中国信息通信研究院云大所、中国人工智能产业发展联盟和腾讯公司联合发布了智能文字识别能力评测与应用白皮书,这份白皮书从 OCR 发展背景、技术沿革、产业发展现状、技术标准化、发展趋势等多个维度,对国内OCR现状进行了一次详细梳理,为OCR的可持续、健康发展打下了坚实的基础,相信也将为各行各业的数字化、智能化转型提供了一份极具价值的参考资料。人工智能 + 产业发展前景广阔、潜力巨大,让我们共同探索,拥抱美好未来。此为序。邱跃鹏腾讯公司副总裁 序言06序言谢呼腾讯公司副总裁从农业文明和工业文明一路走来,社会逐渐步入信息高速流动的数字文明时代。推动人类文明走向新一轮创新浪潮的正是信息采集、处理和使用技术,计算机视觉处理技术 OCR 生当其时。风生于地,起于青萍之末。时代的巨变从来不是骤然而至,社会的每个角落早已撒下了微小的种子。新基建拉开人工智能高速发展的帷幕,我们将要迎来万物智能、人机共生的崭新时代,OCR 作为最接地气的人工智能技术之一,已经进入我们生产生活的方方面面。在人工智能技术向前的每一步探索中,OCR都发挥着计算机“眼睛”的功能,支持和指引着技术前进的脚步。与此同时,我们也要意识到现今被广泛使用的云端 OCR 同样存在着侵犯用户隐私、数据泄露等安全风险,我们必须不断提升技术安全和抗击风险的保障能力。为此,中国信息通信研究院云大所、中国人工智能产业发展联盟、腾讯云 AI 计算机视觉中心、安全战略研究部、优图实验室联合研究撰写了智能文字识别能力评测与应用白皮书。白皮书系统梳理了 OCR 的技术产业现状,技术标准与规范、评估测试与实际应用等部分,是业内首份聚焦智能文字识别的白皮书。同时,产业安全问题始终是我们的关切所在,为此腾讯安全战略研究部立足安全领域深耕细作,联合内外部多个团队探索产业互联网安全战略,培育网络安全新生态,努力构建产业互联网的“安全防火墙”。发展人工智能产业任重道远,OCR 作为一项通用性、基础性技术既是起点,也是远方。新的视野即将打开,我们愿意分享产业互联网时代每一项技术给用户带来的快乐和喜悦,并默默守护他们的安全,为产业发展与安全贡献腾讯的智慧和力量。07智能文字识别能力评测与应用白皮书将图像、视频中的文字转变为机器可读可处理的字符信息,一直是计算机信息处理追求的目标,是机器与现实世界进行视觉交互的重要基础,这也催生了光学字符识别(OCR,Optical Character Recognition)技术。早期的 OCR 技术可追溯到 1870 年,电报技术和为盲人设计的阅读设备的出现标志着OCR技术的诞生。近年来,随着计算机视觉、自然语言理解、知识图谱等人工智能技术在 OCR 中实际使用,OCR 的性能和效率都得到了质的飞跃。目前,OCR 作为一种相对成熟的人工智能技术,已经在金融、交通、政务、医疗、物流等垂直领域得到了广泛应用。单据处理、车牌识别、证照核验等 OCR 应用不仅仅极大地释放人的体力和脑力,节省了大量成本,已经成为支撑各垂直行业数字转型、智能升级、融合创新的重要基础能力。中国人工智能产业发展联盟(AIIA)在芯片、开源框架、智能语音、计算机视觉、自然语音理解等技术领域积累了很多的研究成果。为了进一步帮助技术和产业界了解 OCR 技术的发展历程,探讨在用户的角度如何更好评估评价不断进步的 OCR 技术及产品,依托 AIIA 平台,中国信息通信研究院云计算与大数据研究联合腾讯云 AI 计算机视觉产品中心、安全战略研究部和优图实验室等共同撰写了智能文字识别能力评测与应用白皮书。该白皮书对 OCR 的技术路线以及实现进行了深入的分析,对如何评价基于计算机视觉、自然语言理解、知识图谱技术的 OCR 进行了详细分析和讨论,并提出了相关的评估评价指标和方法。下一步,我们还将在已有研究和评估评测工作基础上,继续与合作伙伴一起不断深化研究,制定细分领域的标准规范等,为技术和产业界提供权威参考。感谢产业界各方对中国信息通信研究院和AIIA工作的大力支持,希望我们继续携手奋进,共同为我国人工智能产业的发展作出更大贡献。魏凯中国信息通信研究院云计算与大数据研究所副所长序言08目录OCR 发展背景概述序言1. OCR 的基本概念和作用 (1)OCR 概念与内涵(2)OCR 是机器处理图像文本的基础 2. OCR 持续向社会生产生活领域渗透(1)人工智能技术发展提升 OCR 性能(2)服务载体多样化加快 OCR 的普及(3)产业数字化进一步扩大 OCR 应用场景3. OCR 在新基建背景下迎来新的机遇(1)OCR 是新基建提供的重要能力之一(2)新基建加速 OCR 产业新生态的构建(3)新基建推动 OCR 的新一轮技术创新/OCR 技术发展现状分析1. OCR 技术历史沿革2. OCR 技术分类概述(1)传统方法受限于手工设计特征(2)基于深度学习的 OCR 包括两类3. OCR 技术发展趋势(1)一体化的端到端 OCR 模型(2)兼具高性能高效率的 OCR(3)从感知到认知的智能 OCRCONTENTS10-1305-0714-20101112141619
展开阅读全文