声纹检测通用规范DB34/T 4739-2024.pdf

返回 相关 举报
声纹检测通用规范DB34/T 4739-2024.pdf_第1页
第1页 / 共7页
声纹检测通用规范DB34/T 4739-2024.pdf_第2页
第2页 / 共7页
声纹检测通用规范DB34/T 4739-2024.pdf_第3页
第3页 / 共7页
声纹检测通用规范DB34/T 4739-2024.pdf_第4页
第4页 / 共7页
声纹检测通用规范DB34/T 4739-2024.pdf_第5页
第5页 / 共7页
点击查看更多>>
资源描述
ICS 17.140.99 CCS L 70 34 安徽省地方标准 DB34/T 47392024 声纹检测 通用规范 General specification for voiceprint detection 2024-04-15 发布 2024-05-15 实施 安徽省市场 监 督管理 局 发 布.DB34/T 47392024 前 言 本文件 按照GB/T 1.12020 标准 化工 作导则 第1 部分:标准化 文件 的结构 和起草 规则 的规 定起草。请注意 本文 件的 某些 内容 可能涉 及专 利。本文 件的 发布机 构不 承担 识别 专利 的责任。本文件 由安 徽省 工业 和信 息化厅 提出 并归 口。本文件 起草 单位:科大 讯 飞股份 有限 公司、安徽 省 质量和 标准 化研 究院、合 肥智能 语音 创新 发展 有限公司、合 肥产 品质 量监 督检验 研究 院。本文件 主要 起草 人:宫韬、褚繁、程鸣、李俊、蔡 明琦、张迪、车骋、徐甲 甲、李 心、储 汉卿、任颖、凌 俊杰、宋 若淼、李 然。I DB34/T 47392024 声 纹检测 通用规范 1 范围 本文件 规定 了声 纹检 测的 准备和 方法 要求。本文件 适用 于工 业产 品和 工业设 备的 声纹 检测。2 规范性 引用 文件 本文件 没有 规范 性引 用文 件。3 术语和 定义 下列术 语和 定义 适用 于本 文件。3.1 声纹 voiceprint 工业产 品和 工业 设备 发出 声波信 号中 的特 征信 息。3.2 声纹检 测 voiceprint detection 运用电 声学 系统,利 用人 工智能 等技 术测 试和 分析 工业产 品和 工业 设备 声纹 的过程。4 检测准备 声音采 集 4.1 4.1.1 总体要 求 多次声 音采 集过 程中 的环 境参数、采 集方 式、采集 音频参 数、采集 样本 时长 和总量 应保 持一 致。4.1.2 采集设 备 4.1.2.1 采集设 备包 括但 不限 于:拾音设 备、模数 转换、编 码器、存储 设备。4.1.2.2 采集设 备性 能指 标应 根据 采集对 象合 理适 配,编码 格式宜 采 用 PCM 编码,模数 转 换量 化精度宜 大 于等于 16 bit。4.1.3 采集方 式 4.1.3.1 拾音设 备与 被采 集对 象应 相对固 定。4.1.3.2 拾音设 备宜 贴近 被采 集对 象,采 集方 向宜 正对 被采 集对象 发声 位置。4.1.4 采集环 境 4.1.4.1 采集过 程中 应避 免出 现采 集环境 之外 的其 他异 常噪 声。4.1.4.2 采集环 境噪 声宜 不 大于 30 dB(A)。4.1.5 采集音 频参 数 1 DB34/T 47392024 采集的 音频 参数 应符 合以 下要求:a)采样率:48 K;b)峰值幅 度:-18 dBFS 且-3 dBFS。4.1.6 采集样 本 样本应 覆盖 所有 正常 和异 常类别,单 条样 本时 长不 小于10 秒,样本 总量 每个 类别不 小于500 条。标注 4.2 4.2.1 标注方 法 4.2.1.1 在计算 机上对 采集 到的声 音样本 进行标 注,对样本 所进行 的标注 包括 两种标 注类别(正 常 和异常类 别),每 个样 本应 仅有一 种标 注类 别。4.2.1.2 检测人 员使用 计算 机上的 音频播 放软件 对待 标注样 本进行 辨听,再进 行标注 结果记 录,若 无法判断 是否 为异 常可 注明 无法判 断。4.2.2 标注格 式 标注完 成后形 成标 注记录,存储 于关系 型数 据库中,声纹 样本标 注字 段见表1。若待 标注样 本为 正常声纹,则 异常 开始 时间 和异常 结束 时间 一栏 为斜 杠符(/)。表1 声纹样 本标 注字 段说 明 字段名称 字段类型 字段描述 备注 VoiceId String 音频ID MarkTime Long 样本时长 单位:毫秒 MarkPerson String 标注人员编号 录入人员编号 Abnormal String 声纹类型标签 正常/异常/无法判断 StartPoint Double 异常开始时间 单位:毫秒 EndPoint Double 异常结束时间 单位:毫秒 建立模 型 4.3 对检测 人员标 注为 正常/异 常的声 音样本 提取 声学特 征,利 用机器 学习 算法对 声学特 征进行 建模,得到可 区分 正常 和异 常类 别的声 纹分 类模 型,用于 进行后 续声 纹检 测任 务。5 检测流 程图 检测流 程图 见图1。2 DB34/T 47392024 图1 检测流 程图 6 方法 部署拾 音设 备 6.1 6.1.1 应 符合 4.1.2 和4.1.3 规定 的 要求。6.1.2 单个工 业设 备或 工业 产品 对应一 个拾 音设 备。6.1.3 拾音设 备应 连接 模数 转换 器形成 拾音 设备 系统。采集现 场声 音 6.2 6.2.1 采集环 境 在生产 线环 境下 进行,采 集环境 噪声 宜不大 于30 dB(A),可使 用专 业降 噪设 备 降低周 围环 境噪声。6.2.2 采集音 频参 数 应符合4.1.5规定 的要 求。6.2.3 采集样 本 单条样 本时 长为10秒,样本 总 量为10 条。比对 6.3 将现场 采集的10条声 音 样本 通过 模数转 换后,输入 至4.3中 可区 分正常 和异 常 类别的 声纹分 类模 型进行比 对,得到10条 模型 判定结 果。检测结 果输 出 6.4 6.4.1 若 其中 5 条以 上(包括 5 条)被 判定 为正 常,则被 检测对 象判 定为 正常 状态。6.4.2 若 其中 6 条以 上(包括 6 条)被 判定 为异 常,则被 检测对 象判 定为 异常 状态。6.4.3 若对多 个工业 产品 或工业 设备检 测,按 单个 工业产 品或工 业设备 的方 法进行,并一 次性输 出 检测结果。3
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642