数据元件 第1部分:结构要求DB3203/T 1056—2024.pdf

返回 相关 举报
数据元件 第1部分:结构要求DB3203/T 1056—2024.pdf_第1页
第1页 / 共25页
数据元件 第1部分:结构要求DB3203/T 1056—2024.pdf_第2页
第2页 / 共25页
数据元件 第1部分:结构要求DB3203/T 1056—2024.pdf_第3页
第3页 / 共25页
数据元件 第1部分:结构要求DB3203/T 1056—2024.pdf_第4页
第4页 / 共25页
数据元件 第1部分:结构要求DB3203/T 1056—2024.pdf_第5页
第5页 / 共25页
点击查看更多>>
资源描述
ICS 35.020 CCS L 70 3203 徐州市地方标准 DB 3203/T 1056 2024 数据元件 第 1 部分:结构要 求 Data components-Part 1:Requirements for structure 2024-07-31 发布 2024-09-01 实施 徐州市市 场监督 管 理局 发 布 DB 3203/T 1056 2024 I 目 次 前言.III 引言.IV 1 范围.1 2 规范 性引 用文 件.1 3 术语 和定 义.1 4 结构.2 5 类型.2 总 体原 则.2 5.1 组 态数 据元 件.3 5.2 模 态数 据元 件.3 5.3 组 合态 数据 元件.3 5.46 命名.3 要素.3 6.1 方式.3 6.27 标识.4 组 成形 式.4 7.1 世 界各 国和 地区 名称 代码.4 7.2 区 域码.4 7.3 类 别码.4 7.4 类 型码.5 7.5 顺 序码.5 7.6 子码.5 7.7 应 用示 例.5 7.88 核心 元数 据.5 属性.5 8.18.1.1 取值.5 8.1.2 中文 名称.5 8.1.3 定义.5 8.1.4 英文 名称.5 8.1.5 短名.6 8.1.6 数据 类型.6 8.1.7 约束 类型.6 8.1.8 取值 示例.6 描述.6 8.28.2.1 业务 元数 据.6 8.2.2 技术 元数 据.7 DB 3203/T 1056 2024 II 8.2.3 管理 元数 据.9 附录A(资料性)数据资 源到 数据 元件 的转 换过程 及应 用场 景示 例.17 参考文 献.19 DB 3203/T 1056 2024 III 前 言 本文件 按照GB/T 1.1 2020 标准 化工 作导则 第1 部分:标准化 文件 的结构 和起草 规则 的规 定起草。本文件 是DB 3203/T 1056 数据 元件 的 第1 部分。DB 3203/T 1056 已经 发布 了以下 部分:第1部 分:结构 要求。请注意 本文 件的 某些 内容 可能涉 及专 利。本文 件的 发布机 构不 承担 识别 专利 的责任。本文件 由徐 州市 大数 据管 理中心 提出 并归 口。本文件 起草 单位:徐 州市 大数据 管理 中心、中 电数 据产业 集团 有限 公司、中 电数创(北 京)科 技 有限公司。本文件 主要 起草 人:谭睿、陆志 鹏、王冬 梅、国丽、胡成 盛、许朝、孙 晓冰、李宏 辉、杨二 龙、韩耀、刘 松江、黄 岩、孙自 立、杨 伟伟。DB 3203/T 1056 2024 IV 引 言 数据元 件是 连接 数据 供需 两端的“中间 态”,是 原始 数 据与应 用之 间的 数据 初级 产品和 交易 标的 物,实现了 从设计、开 发调试、生产 管理到 入库 编目的 全流程 安全合 规 管 控,进 而实现“数据 可用 不可 见,数据不 动程 序动”。DB 3203/T 1056 数 据元 件 是结 合地 方法 规要 求,指导数 据元 件开 发商 和数 据运营 商进 行数 据 元件的 设 计、开发、交 易 和 管理。拟由 五个 部分 组成:第1 部 分:结构 要求。目 的在于 对数 据元 件的 结构 进行规 范化 表示,对 数据 元件设 计、开发等提供 指导,并 给出 相关 信息;第2 部 分:安全 审核 要求。目的 在于 对数 据元 件的 设计、开发 等流 程进 行安 全审核,保 障对数据元 件的 安全 管控,对 数据元 件的 审核 流程 提供 指导,并给 出相 关信 息;第3 部 分:质量 评价 与管 理规范。目 的在 于对 数据 元件的 质量 进行 规范 化评 价和管 理,对数据元件 的质 量检 测流 程提 供指导,并 给出 相关 信息;第4 部 分:分类 分级 指南。目的 在于 提升 数据 元件 的安全 管理 水平,对 数据 运营商 提供 方法指导,并给 出相 关信 息;第5 部 分:估值 与定 价指 南。目 的在 于对 数据 元件 的价值 进行 合理 评估 和定 价,指 导数 据元件开发 商和 数据 运营 商对 数据元 件进 行价 值评 估,并给出 相关 信息。本文件 规定 了 数 据元 件的 结构、类型、命 名、标识 和 核心元 数据 的要 求,明确 了数据 元件 的规 范 化表示,对 数 据元 件开 发商 和数据 运营 商开 发和 管理 数据元 件具 有指 导意 义。DB 3203/T 1056 2024 1 数 据元件 第 1 部 分:结 构要求 1 范围 本文件 规定 了数 据元 件的 结构、类型、命 名、标识 和核心 元数 据的 要求。本文件 适用 于数 据要 素生 产和流 通过 程中 数据 元件 的描述、设计、开发 与应 用,所 定义 的数 据元 件类型主 要为 结构 化数 据,不涉及 自然 语言、图 像等 非结构 化与 其他 复杂 类数 据。2 规范性 引用 文件 下列文 件中 的内 容通 过文 中的规 范性 引用 而构 成本 文件必 不可 少的 条款。其 中,注日 期的 引用 文件,仅该日 期对 应的 版本 适用 于本文 件;不注 日期 的引 用文件,其 最新 版本(包 括所有 的修 改单)适 用 于 本文件。GB/T 2260 中 华人 民共 和 国行政 区划 代码 GB/T 2659.2 世界 各国 和 地区及 其行 政区 划名 称代 码 第2部 分:行政 区划 代 码 GB/T 21063.3 政务 信息 资源目 录体 系 第3 部分:核心元 数据 DB 32/T 4040.1 政 务大 数据 数据 元规 范 第1部 分:总 则 3 术语和 定义 下列术 语和 定义 适用 于本 文件。3.1 数据 data 任何以 电子 或者 其他 方式 对信息 的记 录。来源:GB/T 41479 2022,3.1 3.2 数据集 dataset 具有一 定主 题,可以 标识 并可以 被计 算机 处理 的 数 据集合。来源:GB/T 36344 2018,2.6 3.3 数据资源 data resource 在生产、生 活和 管理 等社 会活动 中以 数字 化形 式留 存 的数据 总称。3.4 数据脱 敏 data desensitization 对数据 资源 进行 处理,屏 蔽敏感 数据 的一 种数 据保 护方法。3.5 数据元 件 data component 具有一 定主 题,通过 对数 据资源 脱敏 处理 后,根据 需要由 若干 相关 字段 形成 的数据 集或 由数 据 资 源的关联 字段 通过 建模 形成 的数据 特征。3.6 组态数 据元 件 composed data component DB 3203/T 1056 2024 2 数据资 源脱 敏处 理后,由 若干个 相关 字段 形成 的数 据集。3.7 模态数 据元 件 modal data component 数据资 源的 关联 字段 通过 建模形 成的 数据 特征。3.8 组合态 数据 元件 combinatorial data component 组态数 据元 件和 模态 数据 元件的 组合。3.9 数据元 件模 型 data component model 使用数 据资 源开 发数 据元 件过程 中所 采用 的某 些规 则、算 法等 构造 的数 据模 型。3.10 元数据 metadata 定义和 描述 其他 数据 的数 据。来源:GB/T 26816 2011,3.2.18 4 结构 数据元 件的 结构 内容 应包 括以下 四部 分:4.1 a)类型:从形 态特 征来 进行 描述;b)命名:从命 名要 素和 命名 方式来 描述;c)标识:从标 识符 组成 和标 识符形 式来 描述;d)核心元 数据:包括 业 务元 数据、技术 元数 据和 管理 元数据。数据元 件的 结构 见 图1。4.2 图1 数据元 件的 结构 图 5 类型 总体原 则 5.1 5.1.1 数据元 件 应 遵守 以下 原则:a)最小必 要原 则:数 据元 件 构建所 使用 的数 据资 源不 宜包含 过多 信息,对数 据 资源表 的字 段数、记录数 和数 据存 储量 等进 行约束 控制;DB 3203/T 1056 2024 3 b)去 标 识化 或 主体 授权 同 意 原则:对 于 涉及 政府、组织、企业 或 个人 等重 要 数据 和 敏感 信息,去除主 体标 识或 者主 体授 权同意;c)不可逆 原 则:数 据元 件 模型 保 证数 据 元件 结果 不 可逆 回 到数 据 资源,确 保 数据 的 使用 者无法根据数 据元 件提 供的 信息 还原出 数据 原貌。5.1.2 数据资 源到 数据 元件 的转 换过程 及应 用场 景示 例,见附 录A。组态数 据元 件 5.2 5.2.1 组态数 据元件 应对 原始数 据资源 中敏感 信息 进行脱 敏处理,除敏 感字 段外,输出字 段内容 与 选取的原 始数 据资 源字 段相 同。5.2.2 原始数 据资 源使 用的 有效 数据字 段个 数 应 不少 于3 个、应 不超 过 12 个。5.2.3 单次输 出的 数据 量 应 不超 过30 万条 记录。示例:企业基本信息包含企业名称、企业人员规模、企业营业收入等,通过对企业名称进行脱敏处理后,形成徐州市企业基本信息元件,表示为:2022 年徐州市规上企业基本 信息元件。模态数 据元 件 5.3 5.3.1 模态数 据元 件输 出的 特征 字段 应 是新 的字 段。5.3.2 模态数 据元 件包 含的 特征 字段个 数 应 为 1 个。5.3.3 单个模 态数 据元 件 应 是单 个对象 输出 的特 征记 录。5.3.4 同类模态 数 据元 件单 次输 出的数 据量 应不超过 30 万 条记录。示例:企业财务信息包括资产负债率、净资产、主营业务占比等字段信息,通过数学建模可形成财务特征元件,用于企业信贷业务,表示为:2022 年徐州市中小企业财务特征 元件。组合态 数据 元件 5.4 5.4.1 原始数 据资 源使 用的 有效 数据字 段个 数 应 不少 于3 个、应 不超 过 12 个。5.4.2 组合态 数据 元件 包含 的特 征字段 个数 应不超过 12 个。5.4.3 单次输 出的 数据 量 应 不超 过30 万条 记录。示例:2022 年徐州市中小企业经营特 征元件包含2022 年徐州市中小 企业基本信息和2022 年徐州市 中小企业财务特征,用于企业信贷业务,表示为:2022 年徐州市中小企业经 营特征元件。6 命名 要素 6.1 6.1.1 数据元 件命 名应 包含 以下 要素:a)限定要 素:1)时间:可选 要素,表 示数 据元件 涉及 的时 间范 围,如年、月等;2)地域:可选 要素,表 示数 据元件 涉及 的地 域,包括 国家、地区 等;3)行业领 域:可选 要素,表 示数据 所属 的行 业领 域。b)主体要 素:1)数据对 象:必选 要素,表 示数据 元件 所涉 及的 数据 对象主 体;2)信息主 题:必选 要素,表 示数据 元件 所包 含内 容的 概要描 述及 数据 粒度 相关 信息。6.1.2 数据元 件命 名长 度不 宜超 过 30 个字 符。方式 6.2 DB 3203/T 1056 2024 4 6.2.1 数据元 件命 名应 符合“限 定要素”+“主 体要 素”+“数据 元件”表 达方 式的 要求。6.2.2 限定要 素的 取舍 应符 合以 下要求:a)数据元 件 的 命名 中 不 包含 限定要 素时,无其 描述;b)不 造成 歧义 时,可省 略 其 描述;c)命 名 要素 不 满足 实际 描 述需 求 时,应 根据 数据 元 件内 容 增加 时 间、地域 或 行业 领 域的 限定要素描述。示例1:徐州市人流量分布数据元件(其中不含时间和行业领域限定要素)。示例2:2022 年徐州火车站客流量统计 数据元件(省略行业领域限定要素)。7 标识 组成形 式 7.1 标识 应 由数 据元 件的 世界 各国和 地区 名称 代码、区 域码、类别 码、类型 码、顺 序码和 子码 依次 连 接组成,见图2。图2 数据元 件的 标识 组成 形式 世界各 国和 地区 名称 代码 7.2 7.2.1 世界各 国和地 区名 称代码 为数据 资源所 在国 家或地 区代码,应采 用三 位大写 字母编 码,应 符 合GB/T 2659.2 中 关于“三 字符拉 丁字 母代 码结 构”的规定。示例:中国 CHN 7.2.2 数据源 不属 于单 个国 家或 地区 时,则 应 用大 写字 母 AAA 表示,数 据来 源不 明 确,则 应 用大 写字母 XXX 表 示。区域码 7.3 7.3.1 数据资 源归 属地(省、市、县)的行 政区 划代 码,应采用 6 位 数字 代码,应 符合GB/T 2260 的规定。示例:徐州 320300 7.3.2 数据资 源包 括两 个或 两个 以上行 政区,应 采用 上一 级 别行政 区代 码表 示;当上 一 级别为 国家 时,应 用 111111 表 示。7.3.3 数据来 源不 明确 时,则 应 用 000000 表示,数 据资 源为境 外资 源 时,则 应 用 999999 表 示。类别码 7.4 类别码 应 由1 位 阿拉 伯数 字表示:1:标 准数 据元 件;DB 3203/T 1056 2024 5 2:定 制数 据元 件。类型码 7.5 类型码 应由1位 阿拉 伯数 字 表示:1:组 态数 据元 件;2:模 态数 据元 件;3:组 合态 数据 元件。顺序码 7.6 顺序码 为 数 据元 件 的 顺序 编 号,应 由10 位阿 拉伯 数 字表示,其中 前4 位为 年份,后6位 为数 据元件 的设计或 生产 或制 造的 顺序 编号。子码 7.7 子码为 同类 数据 元件 自定 义对象 个体 代号,应 由不 定长数 字与 字母 组合。根 据应用 的 需 求应 自 定义数据元 件子 码的 数量 和编 码的位 数。注:数据元件子码的数量和编码的位数 由数据元件中对象个数测算得出。应用示 例 7.8 由江苏 省徐 州市 云龙 区的 数据资 源作 为原 材料 加工,2022 年 生产 的第123 个准 模 态数据 元件 的1 号数据元件 主体 对象 的记 录 表 示为:CHN320303122022000123-1。由境外(美国)的数据资源作为原材料加工,2022 年生产的第123 个 定 制 组 态 数 据 元 件 表示为:USA999999212022000123。8 核心元 数据 属性 8.1 8.1.1 取值 数据元 件的 核心 元数 据元素 应按 照以 下方 式进 行 取 值:中文名 称;定义;英文名 称;短名;数据类 型;约束类 型。8.1.2 中文名 称 以字符 串的 形式 表示。8.1.3 定义 以字符 串的 形式 表示。8.1.4 英文名 称 以字符 串形 式表 示。DB 3203/T 1056 2024 6 8.1.5 短名 应符 合GB/T 21063.3 的 取 值规则。8.1.6 数据类 型 数据类 型 应 符合 下列 五种:a)字符型:描 述字 符类 型的 属性;b)数值型:描 述整 数、浮点 数等类 型的 属性;c)日期型:描 述有 日期 相关 的属性;d)日期时 间型:描 述与 日期 和时间 相关 的属 性;e)布尔型:描 述是/否、真/假等类 型的 属性。8.1.7 约束类 型 约束类 型应 符合 下列 三种:a)M:必 选,表示 该数 据元 件 属性是 必备 的;b)C:条 件必 选,满足 约束 条 件中所 规定 的要求 时 必须 选择;c)O:可 选,表示 该数 据元 件 属性根 据实 际应 用是 可选 的。8.1.8 取值示 例 数据元 件 的 核心 元数 据元 素 开发 单位 名称 的取 值 为:XX信 息技 术有 限公 司。描述 8.2 8.2.1 业务元 数据 8.2.1.1 取值 数据元 件的 业务 元数 据取 值应包 括:标识符;名称;英文名;类型;摘要;关键词。8.2.1.2 标识符 定 义:在 特定 范围 内给 予 数据元 件的 唯一 标识。按 照第7 章给 出的 规则 编制。英文名 称:componentID。短 名:comID。数据类 型:字符 型。约束类 型:M。取值示 例:CHN320300122022000321-1。8.2.1.3 名称 定 义:数 据元 件的 命名。按照第6章 给出 的规 则编 制。英文名 称:componentTitle。DB 3203/T 1056 2024 7 短 名:comTitle。数据类 型:字符 型。约束类 型:M。取值示 例:徐州 市居 民每 月用电 特征 数据 元件。8.2.1.4 英文名 定 义:数 据元 件的 英文 名 称。英文名 称:englishTitle。短 名:enTitle。数据类 型:字符 型。约束类 型:M。取值示 例:MonthlyElectricityConsumptionCharacteristicDataComponentsforXuzhouResidents。8.2.1.5 类型 定 义:数 据元 件的 形态 特 征。英文名 称:form。短 名:form。数据类 型:字符 型。约束类 型:M。取值示 例:模态。8.2.1.6 摘要 定 义:对 数据 元件 内容 进 行概要 说明 的文 字。英文名 称:abstract。短 名:abstract。数据类 型:字符 型。约束类 型:M。取值示 例:徐州 市居 民用 电特征。8.2.1.7 关键词 定 义:描 述数 据元 件的 通 用词、术语 或短 语。英文名 称:keyword。短 名:keyword。数据类 型:字符 型。约束类 型:O。取值示 例:居民 用电。8.2.2 技术元 数据 8.2.2.1 取值 数据元 件的 技术 元数 据取 值应包 括:字段数;记录数;DB 3203/T 1056 2024 8 存储量;标签;区域范 围;时间范 围;更新频 率;生存周 期;生产机 制。8.2.2.2 字段数 定 义:数 据元 件包 含的 列 数。英文名 称:numberOfFields。短 名:fieldNum。数据类 型:数值 型。约束类 型:C。取值示 例:2。8.2.2.3 记录数 定 义:数 据元 件包 含的 记 录条数。英文名 称:numberOfRecords。短 名:recordNum。数据类 型:数值 型。约束类 型:C。取值示 例:2000。8.2.2.4 存储量 定 义:数 据元 件占 用的 存 储空间。英文名 称:storage。短 名:storage。数据类 型:数值 型。约束类 型:O。取值示 例:1kb。8.2.2.5 区域范 围 定 义:数 据元 件内 容涉 及 的地域、空 间范 围。英文名 称:spatialDomain。短 名:spatDom。数据类 型:字符 型。约束类 型:O。取值示 例:XX市XX区。8.2.2.6 时间范 围 定 义:数 据元 件内 容的 时 间覆盖 范围。英文名 称:period。DB 3203/T 1056 2024 9 短 名:period。数据类 型:字符 型。约束类 型:O。取值示 例:不限。8.2.2.7 更新频 率 定 义:数 据元 件的 更新 周 期。英文名 称:updateFrequency。短 名:updFreq。数据类 型:字符 型。约束类 型:M。取值示 例:按月 更新。8.2.2.8 生存周 期 定 义:数 据元 件可 使用 的 有效期 限。英文名 称:lifeCycle。短 名:lifeCycle。数据类 型:字符 型。约束类 型:O。取值示 例:永久。8.2.2.9 生产机 制 定 义:数 据元 件的 开发 生 产机制,分 为标 准数 据元 件和定 制数 据元 件两 类。英文名 称:modeOfProduction。短 名:prodMode。数据类 型:字符 型。约束类 型:M。取值示 例:标准 数据 元件。8.2.3 管理元 数据 8.2.3.1 取值 数据元 件的 管理 元数 据取 值应包 括:信息领 域;质量等 级;价值评 级;安全分 级;数据项 信息;最新修 改日 期;是否出 境;数据跨 主体 流动;数据安 全风 险评 估;评估机 构;DB 3203/T 1056 2024 10 评估时 间;评估结 论;整改措 施;数据来 源单 位名 称;数据归 集单 位名 称;元件开 发单 位;发布时 间;元件管 理单 位;供给方 式;用途;备注。8.2.3.2 信息领 域 定 义:基 于数 据元 件的 信 息内容 按领 域分 类。英文名 称:informationDomain。短 名:infoDom。数据类 型:字符 型。约束类 型:M。取值示 例:资源 能源。8.2.3.3 质量等 级 定 义:基 于数 据元 件质 量 评估结 果分 级。英文名 称:qualityLevel。短 名:qualityLvl。数据类 型:字符 型。约束类 型:M。取值示 例:优。8.2.3.4 价值评 级 定 义:根 据数 据元 件价 值 评估分 级。英文名 称:valueLevel。短 名:valueLvl。数据类 型:字符 型。约束类 型:M。取值示 例:一级。8.2.3.5 安全分 级 定 义:数 据元 件安 全评 估 后的等 级。英文名 称:securityLevel。短 名:securityLvl。数据类 型:字符 型。约束类 型:M。取值示 例:非受 限流 通。DB 3203/T 1056 2024 11 8.2.3.6 数据项 信息 定 义:数 据元 件包 含属 性 字段信 息。英文名 称:FieldInformation。短 名:FieldInfo。数据类 型:字符 型。约束类 型:O。取值示 例:用电 特征。8.2.3.6.1 数据项 中文 名 定 义:数 据项 名称,即 数 据资源 中具 体数 据项 的标 题。英文名 称:fieldName。短 名:fieldName。数据类 型:字符 型。约束类 型:O。取值示 例:用电 特征。8.2.3.6.2 数据项 英文 名 定 义:数 据项 在数 据库 中 的英文 名称。英文名 称:fieldEnglishName。短 名:fieldEnName。数据类 型:字符 型。约束类 型:O。取值示 例:ElectricityUsageFeature。8.2.3.6.3 数据项 类型 定 义:数 据属 性项 的类 型。英文名 称:fieldType。短 名:fieldType。数据类 型:字符 型。约束类 型:O。取值示 例:良好。8.2.3.6.4 数据项 长度 定 义:数 据属 性项 存储 占 用的字 节数。英文名 称:fieldLength。短 名:fieldLen。数据类 型:数值 型。约束类 型:O。取值示 例:2。8.2.3.7 最新修 改日 期 定 义:最 近一 次修 改数 据 元件的 日期。DB 3203/T 1056 2024 12 英文名 称:dateOfUpdate。短 名:updDate。数据类 型:日期 型。约束类 型:M。取值示 例:2022-01-01。8.2.3.8 是否出 境 定 义:数 据是 否跨 境流 通。英文名 称:isCrossBorder。短 名:isCBorder。数据类 型:布尔 型。约束类 型:C。取值示 例:否。8.2.3.9 数据跨 主体 流动 定 义:数 据是 否跨 主体 流 动。英文名 称:isCrossEntity。短 名:isCEntity。数据类 型:布尔 型。约束类 型:C。取值示 例:否。8.2.3.10 数据安 全风 险评 估 定 义:数 据安 全风 险评 估 信息。英文名 称:dataSafetyRiskAssessment。短 名:dataSafetyRiskAssmt。数据类 型:字符 型。约束类 型:C。取值示 例:风险 级别 为一 级。8.2.3.11 评估机 构 定 义:数 据安 全风 险评 估 机构名 称。英文名 称:assessmentAuthority。短 名:assmtAuth。数据类 型:字符 型。约束类 型:C。取值示 例:徐州 市某 安全 风险评 估机 构。8.2.3.12 评估时 间 定 义:数 据安 全风 险评 估 时间。英文名 称:dateOfAssessment。短 名:assmtDate。数据类 型:日期 型。DB 3203/T 1056 2024 13 约束类 型:C。取值示 例:2022-01-01。8.2.3.13 评估结 论 定 义:数 据安 全风 险评 估 结论。英文名 称:assessmentConclusion。短 名:assmtConcl。数据类 型:字符 型。约束类 型:C。取值示 例:泄露 后对 个人 造成较 小影 响。8.2.3.14 整改措 施 定 义:安 全问 题整 改情 况。英文名 称:correctiveMeasures。短 名:corMeasures。数据类 型:字符 型。约束类 型:C。取值示 例:立即 加强 数据 安全管 理。8.2.3.15 数据来 源单 位名 称 定 义:数 据资 源提 供单 位 的名称。英文名 称:sourceOrganisation。短 名:sourceOrg。数据类 型:字符 型。约束类 型:O。取值示 例:XX市 电力 集团 有限公 司。8.2.3.16 数据归 集单 位名 称 定 义:数 据资 源归 集管 理 单位名 称。英文名 称:collectionOrganisation。短 名:collectOrg。数据类 型:字符 型。约束类 型:O。取值示 例:XX市 大数 据管 理中心。8.2.3.17 元件开 发单 位 定 义:数 据元 件开 发的 单 位信息。英文名 称:DevelopOrganisation。短 名:DevOrg。数据类 型:字符 型。约束类 型:M。取值示 例:XX信 息技 术有 限公司。DB 3203/T 1056 2024 14 8.2.3.17.1 开发单 位名 称 定 义:数 据元 件的 开发 单 位的名 称。英文名 称:developOrganisationName。短 名:devName。数据类 型:字符 型。约束类 型:M。取值 示例:XX 信息 技术 有 限公司。8.2.3.17.2 开发单 位代 码 定 义:数 据元 件开 发单 位 的统一 社会 信用 代码。英文名 称:developOrganisationCode。短 名:devCode。数据类 型:字符 型。约束类 型:O。取值 示例:32580100759100437N。8.2.3.17.3 开发单 位电 话 定 义:数 据元 件开 发单 位 联系电 话。英文名 称:developOrganisationTel。短 名:devTel。数据类 型:字符 型。约束类 型:O。取值示 例:010-87654321。注:多个电话号码,用分号(“;”)分隔。8.2.3.18 发布时 间 定 义:数 据元 件开 发完 成 并经过 审核 后,发布 上线 时间。英文名 称:dateOfPublication。短 名:pubDate。数据类 型:日期 时间 型。约束类 型:M。取值示 例:2022-01-01 10:30:30。8.2.3.19 元件管 理单 位 定 义:数 据元 件的 管理 单 位信息。英文名 称:AdminOrganisation。短 名:AdminOrg。数据类 型:字符 型。约束类 型:M。取值示 例:XX市 政务 服务 数据管 理局。8.2.3.19.1 管理单 位名 称 DB 3203/T 1056 2024 15 定 义:数 据元 件的 管理 单 位名称。英文名 称:adminOrganisationName。短 名:adminName。数据类 型:字符 型。约束类 型:M。取值示 例:XX市 政务 服务 数据管 理局。8.2.3.19.2 管理单 位代 码 定 义:数 据元 件的 管理 单 位的统 一社 会信 用代 码。英文名 称:adminOrganisationCode。短 名:adminCode。数据类 型:字符 型。约束类 型:O。取值示 例:32474636759102452C。8.2.3.19.3 管理单 位电 话 定 义:数 据元 件的 管理 单 位联系 电话。英文名 称:adminOrganisationTel。短 名:adminTel。数据类 型:字符 型。约束类 型:O。取值示 例:010-87654321。注:多个电话号码,用分号(“;”)分隔。8.2.3.20 供给方 式 定 义:数 据元 件被 提供 的 方式。包括API(应 用编 程 接口)、数 据集 等方 式。英文名 称:serviceType。短 名:servType。数据类 型:字符 型。约束类 型:M。取值示 例:数据 集。8.2.3.21 用途 定 义:数 据元 件的 用途 信 息。英文名 称:usage。短 名:usage。数据类 型:字符 型。约束类 型:C。取值示 例:用于 信贷 反欺 诈、授 信辅 助、贷后 预警、空壳 企业 识别 等。8.2.3.22 备注 定 义:对 于数 据元 件的 补 充信息。英文名 称:remark。DB 3203/T 1056 2024 16 短 名:remark。数据类 型:字符 型。约束类 型:O。取值示 例:无。DB 3203/T 1056 2024 17 A A 附录A(资料 性)数据资 源到 数据 元件 的转 换过程 及应 用 场 景示 例 A.1 数据资 源到 数据 元件 的转 换过程 数据资 源到 数据 元件 的转 换,见 图A.1。图A.1 数据资 源到 数据 元件 的转 换示意 图 注1:图A.1中,表示 原始数据资源,表示 由 组合形成的数据集。注2:表示由数据集 转换成的数据元件。注3:表 示 数据 资 源到 数 据元 件的模 型 函 数,F 表示 数 据元 件 到数 据 产 品的 应用 函 数,Y 表 示 基于 数 据 元件 的数 据应用,数据资源到数据元件的转换过程符合数据元件的结构要求。A.2 数据元 件的 应用 场景 示例 以徐州 市市 民健 康信 息为 例,原 始数 据字 段包 括姓 名、身 份证 号、门诊 及住 院信息、出 院诊 疗 结 果等。这些 数据 涉及 到个 人 敏感信 息,直 接流 通将 造 成不好 的社 会影 响。通 过 构建徐 州市 市民 健康 状况 数据元件,显 示有 无慢 性病、有无 大病、有无 传染 病(显示 有无,结合 具体 疾 病类型 显示 评分,疾 病严 重程度越 高,种类 越多 分数 越低)。在满 足求 职、相 亲等应 用场 景的 同时,更 好地保 护了 市民 的隐 私。其中徐州 市市 民健 康状 况数 据元件 核心 元数 据示 例,见表A.1。表A.1 徐州市 市民 健康 状况 数据 元件核 心元 数据 示例 序号 属性描述 数据类型 约束类型 取值 1 标识符 字符型 M CHN320303122022000123-Y 2 名称 字符型 M 徐州市市民健康状况数据元件 3 英文名 字符型 M XuzhouCitizensHealthStatusDataComponent 4 类型 字符型 M 模态 5 摘要 字符型 M 徐州市市民健康状况 DB 3203/T 1056 2024 18 表A.1 徐 州市 市民 健康 状 况数据 元件 核心 元数 据示 例(续)序号 属性描述 数据类型 约束类型 取值 6 关键词 字符型 O 徐州市;健康状况 7 字段数 数值型 C 4 8 记录数 数值型 C 1382 9 存储量 数值型 O 10kb 10 区域范围 字符型 O 江苏省徐州市 11 时间范围 字符型 O 不限 12 更新频率 字符型 M 按月更新 13 生存周期 字符型 O 永久 14 生产机制 字符型 M 标准数据元件 15 信息领域 字符型 M 政务 16 质量等级 字符型 M 优 17 价值评级 字符型 M 一级 18 安全分级 字符型 M 受限流通 19 数据项信息 字符型 O 健康状况 20 最新修改日期 日期型 M 2022/1/1 21 是否出境 布尔型 C 否 22 数据跨主体流动 字符型 C 否 23 数据安全风险评估 字符型 C 一级 24 评估机构 字符型 C 徐州市某安全风险评估机构 25 评估时间 日期型 C 2022/1/1 26 评估结论 字符型 C 泄露后对个人造成较小影响 27 整改措施 字符型 C 加强数据安全管理 28 数据来源单位名称 字符型 O 徐州市XX 医疗机构 29 数据归集单位名称 字符型 O 徐州市大数据管理中心 30 元件开发单位 字符型 M XX 信息技术有限公司 31 发布时间 日期时间型 M 2022/1/1 10:30 32 元件管理单位 字符型 M 徐州市XX 数据管理中心 33 供给方式 字符型 M API 34 用途 字符型 C 可用于求职、相亲等应用场景 35 备注 字符型 O 无 DB 3203/T 1056 2024 19 参考文 献 1 GB/T 5271.1 信息 技术 词汇 第1部 分:基 本术语 2 GB/T 7027 信 息分 类和编 码的 基本 原则 与方 法 3 GB 11714 1997 全 国组织 机构 代码 编制 规则 4 GB/T 18391.1 2002 信息 技术 数 据元 的规 范与标 准化 5 GB/T 19710 2005 地理信 息 元数 据(ISO 19115:2003,MOD)6 GB/T 27000 2006 合格评 定词 汇和 通用 原则 7 GB/T 25069 2010 信息安 全技 术 术语 8 GB/T 26816 2011 信息资 源核 心元 数据 9 GB/T 20000.1 2014 标准 化工 作指 南 第1 部 分:标 准化 和相 关活 动的 通用术 语 10 GB/T 36461 2018 物联 网标 识体 系 OID 应 用指南 11 GB/T 37988 2019 信息 安全 技术 数 据安 全能力 成熟 度模 型 12 GB/T 37728 2019 信息 技术 数 据交 易服 务 平台 通用 功能 要求 13 GB/T 37973 2019 信息 安全 技术 大 数据 安全管 理指 南 14 GB/T 41479 2022 信息 安全 技术 网 络数 据 处理安 全要 求 15 GB/T 35274 2023 信息 安全 技术 大 数据 服务安 全能 力要 求 16 国家 政务 信息 资源 目录编 制指 南(试行)
展开阅读全文
相关资源
相关搜索
资源标签

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642