资源描述
2019-2020电信网络诈骗治理与人工智 能应用 研究报告 目录 一、人 工 智能 在电 信网络 诈 骗治 理中 的积极 影 响及 技术 实践 . 1 (一) 人 工智 能在 电信网 络 诈骗 治理 中的积 极 影响 . 1 (二) 人 工智 能在 电信网 络 诈骗 治理 中的技 术 应用 . 3 (三) 人 工智 能在 电信网 络 诈骗 治理 中的实 践 应用 . 6 二、人 工 智能 给电 信网络 诈 骗治 理带 来的风 险 与挑战 . 9 (一) 电 信网 络诈 骗实施 的 四个 主要 环节 . 10 (二) 在 “精 准信 息获取 ” 环节 . 10 (三) 在 “诈 骗脚 本设计 ” 环节 . 12 (四) 在 “通 讯联 络诱导 ” 环节 . 13 (五) 在 “资 金支 付转移 ” 环节 . 15 三、人 工 智能 背景 下国内 外 电信 网络 诈骗治 理 动态 . 15 (一) 国 际主 要国 家和地 区 治理 经验 做法 . 16 (二) 国 内信 息通 信行业 主 要治 理举 措与成效 . 19 四、人 工 智能 背景 下治理 工 作面 临的 难点与 问 题 . 26 (一) 在 法律 法规 方面 . 26 (二) 在 行业 管理 方面 . 27 (三) 在 技术 利用 方面 . 27 (四) 在 宣传 引导 方面 . 28 (五) 在 协同 治理 方面 . 29 五、人 工 智能 背景 下电信 网 络诈 骗治 理的措 施 建议 . 29 (一) 明 晰 治理 思 路,坚 持 发展 与安 全并举 . 30 (二) 完 善 法律 法 规,加 大 执法 与惩 戒力度 . 31 (三) 强 化 行业 监 管,推 进 源头 与综 合治理 . 31 (四) 加 快 技术 研 发,提 高 识别 与反 制能力 . 32 (五) 创 新 宣传 方 式,增 强 防范 与安 全意识 . 33 (六) 促 进 协同 治 理,深 化 跨行 业与 跨国合作 . 34 一、人工智能在电信网络诈骗治理中的积极影响及技术实践 (一)人工智能在电信网络诈骗治理中的积极影响 随着云计算、大数据、移动互联网的不断发展,人工智能进入到 了一个全新的发展阶段:基础算力不断增强,核心算法不断突破,应 用场景不断丰富,成为引领创新发展的战略性技术。人工智能技术的 蓬勃发展带来了强大的产业拉动效应,不断加速传统产业的数字化、 智能化进程,驱动产业优化升级和生产力快速提升,在推进社会进步、 经济发展、人民生活质量提高等方面产生了重大而深远的影响。 同时,人工智能技术的发展也为电信网络诈骗治理工作带来了积 极影响:随着以大数据分析、机器学习、模式识别、知识图谱为代表 的人工智能技术的部署应用,电信网络诈骗技术防范系统的识别准确 度更高、监测拦截实时性更强、防护覆盖面更大,为治理工作的不断 推进提供了强大动力,有效降低了电信网络诈骗带来的风险与危害。 1、防范识别准确度提高 对诈骗信息和行为的判定识别是防范治理技术工作的基础和前提。相比于人工判定方式,人工智能在诈骗识别方面的应用有效地提 高了判定的准确度及可靠性。首先,通过人工智能技术可以对海量历 史及实时数据进行多维度分析,挖掘不同数据间的内在联系,使得发现隐蔽诈骗线索和行为的能力快速提升。其次,通过对已有诈骗事件 和数据的不 断迭代学习,人工智能技术可以及时全面掌握各类诈骗活 动的行为特征,从而准确识别具备相同和相似特特征的疑似诈骗信息 或行为。 2、监测拦截实时性加强 对电信网络诈骗行为进行实时预警拦截是防范治理工作的一个重要方面。利用人工智能技术通过对电信网、互联网、金融支付等各 方数据的实时分析和深度计算,能够极大提升诈骗信息预警拦截的效率和及时性。从监测拦截角度看,现有人工智能技术可以实时监控疑 似手机黑卡的诈骗流通轨迹,快速研判涉诈行为,实施对手机黑卡或 涉诈号码的秒级溯源和分钟级关停等处置措施。从预警信息推送角度 看,依托人工智能的强大算法和计算能力,可以针对疑似涉诈网站、 APP 的活动行为进行实时记录分析,并根据相关模型对疑似高危受害用户进行实时的预警提醒。 3、反诈防护覆盖面变大 随着基于人工智能的防范治理能力不断提升,反诈技术的防护范围得到极大扩展。从数据分析角度看,人工智能技术能够对海量电信和网络数据进行关联分析并提取有效信息,对疑似受害人群和疑似诈骗团伙的搜索查找覆盖范围大大增加。从通讯联络角度看,基于人工 智能的防范治理技术覆盖到了网络侧、业务侧和用户终端侧等信息通信过程的各个环节,极大地提高了反诈安全防护的用户覆盖范围。从诈骗信息监测角度看,当前人工智能技术能够有效识别诈骗文本、图 片、音视频等各类诈骗信息传播手段,内容监测范围得到明显拓展。 (二)人工智能在电信网络诈骗治理中的技术应用 1、基于大数据分析的技术应用 基于大数据分析的电信网络诈骗防范治理技术应用以数据挖掘分析结果为驱动,整个过程包括“数据采集、数据处理、数据挖掘” 等多个环节。 在数据采集和处理层面,主要有三种 数据来源:在企业自有系统中沉淀的数据、在网上采集爬取的数据和从第三方购买的数据。这些数据经过智能化处理清洗后为后续开展数据分析和挖掘,识别电信网络诈骗行为,构建完备的技术防范体系奠定了数据基础。 在数据挖掘层面,利用大数据的挖掘能力可以发现诈骗行为的典型规律,精准识别诈骗分子和诈骗行为,进而对电信网络诈骗进行准 确预警。 图 1 基于大数据分析的技术应用 2、基于机器学习算法的技术应用 基于机器学习算法的电信网络诈骗防范治理技术应用可以分为 分类和聚类两种应用形式。分类算法通过已知的诈骗样本、案例数据 进行模型训练,在此基础上对新的行为事件进行涉诈风险分析预测。 聚类算法通过全局分析和高维空间聚类,在无诈骗样本数据的情况下 找出数据中隐含的共同特征,从而完成大规模关联诈骗团伙的自动发现。 通过机器学习两种算法的互相结合,可以有效提升发现识别诈骗 行为和团伙的技术能力。以涉诈互联网社交账户识别发现为例,根据 诈骗行为在多维空间向量上距离相近的特征,通过构建以登录时间、 浏览器类型、 IP 地址、 GPS 地址、昵称修改等为特征的多维空间向量, 利用聚类算法可以将 疑似诈骗行为或账户聚为一组并抽取该群组的 共性信息生成训练数据。基于聚类算法生产的训练数据,分类算法能 够在此基础进行模型训练并进一步发现共性样本群组之外的诈骗行 为和账户。两种算法相辅相成,为诈骗风险预警提供高效的检测和研判能力。 3、基于模式识别的技术应用 基于模式识别的电信网络诈骗防范治理技术聚焦已知诈骗行为的样本数据特征,通过分析归纳得到诈骗行为的多维度特征属性并形 成涉诈资源模板库,结合自然语言处理、生物特征识别及大数据挖掘 分析等技术,对目标对象进行相似度交叉比对分析,研判得出目标对 象的涉诈风险,在诈骗电话、诈骗网站的判定识别领域有广泛应用。 以诈骗网址检测识别为例,在提取目标网址的标题、关键词及页面标签元素等多种特征属性的基础上,通过计算目标网址与诈骗资源 模板库中的网址样本之间的特征距离,判断两者之间的相似度。一般来讲,两者特征距离越近说明相似程度越大,目标网址涉嫌诈骗的可能性就越大。 图 2 诈骗网址监测识别 4、基于知识图谱的技术应用 知识图谱是一种基于图的数据结构,可以看作是由数据绘制出来的一张知识图。在防范治理应用中,知识图谱技术能够聚合关联多种 数据源,针对监测目标分析识别其脉络、趋势以及特征,在关键诈骗 信息搜索、账号涉诈风险评估、诈骗团伙研判、异常行为分析等方面 具有重要应用。 以银行卡全周期异常行为分析为例,通过知识图谱技术对全周期内的银行卡关联数据进行分析,并以图的方式进行数据融合及可视化,从而找到银行卡异常行为的内在关联,提升对诈骗资金流的打击 效率。相比于人工核验,其效率提升 10 余倍,准确率约为 99.5%。 图 3 基于知识图谱的银行卡异常行为分析 (三)人工智能在电信网络诈骗治理中的实践应用 结合电信网络诈骗治理实践,目前人工智能技术在诈骗电话检测、恶意网址拦截、诈骗文本识别、诈骗风险预警等场景下已经有深入的应用及探索。 1、诈骗电话检测 电话诈骗是电信网络诈骗中的突出类型,诈骗数量较多,诈骗内 容花样层出不穷,社会影响恶劣。及时尽早地感知、发现诈骗电话, 是减少此类电信网络诈骗活动损失必不可少的方法。由于诈骗分子掌 握大量用于诈骗的号码,传统的基于号码的阻断策略容易被绕过,及 早发现诈骗电话的难度在不断增大。人工智能时代,利用大数据分析、 模式识别等技术可以对海量通信数据进行预处理和数据融合分析研 判,从而进行全天候全方位诈骗电话检测,能够有效增强针对电话诈 骗的防御和反制能力。 以极限元人工智能语音识别、语音关键词检索技术为例,其推出 了诈骗电话检测技术解决方案,可以有效检测识别邮包快递、社保卡、 信用卡等十余种诈骗场景及类型。通过人工智能语音关键词检索技术 对疑似诈骗电话进行匹配识别,不仅提高了检索识别效率,还能有效 避免误判增加识别准确率。 2、恶意网址拦截 恶意网址是指恶意种植木马、病毒等恶意程序的网站,是目前诈骗分子用于窃取用户个人信息、实施网络勒索诈骗的重要方式。人工智能技术用于恶意网址监测拦截主要基于机器学习的分类和聚类方法。 分类方法主要是收集样本数据进行归一化处理后构造分类器识别是否恶意:首先是根据已经标记的 URL 数据集提取静态特征 ( 主机、 URL、网页信息等)和动态特征(浏览器行为,网页跳转关系等), 对提取特征进行归一化处理后通过算法构造分类器来识别恶意网站。 聚类方法略有不同:首先在网页采集的 URL 数据集中提取连接关系、 URL 特征、网页文本信息等特征,再根据聚类算法模型将 URL 数据集划分为若干聚类,相似度较高的 URL 数据会在同一聚类中,反之则归为不同聚类,最后对已标记的聚类结果识别待测 URL,判断其是否为恶意网页。 以腾讯安全云库为例,其利用云端监测技术,基于机器学习算法和大数据平台,进行云端全网海量网址特征比对检测、页面相似度分析,同时配备人工审核团队审核,建立实时更新的黑白样本库。在不同的应用场景下,基于海量数据的样本库不断调整和适配算法,最终选取严格保证准确率的机器学习模型,在保证及时性的同时,也能达 到较好的识别准确率。
展开阅读全文