资源描述
ICS 01.140.20 A14 DB3302 浙江省宁波市 地 方 标 准 DB3302/T 1112 2019 政府网 站 网页归档 与管理规 范 2019-12-23 发布 2020-01-23 实施 宁 波 市 市 场 监 督 管 理 局 发 布 DB3302/T 1112 2019 前 言 本标准 按照GB/T 1.1-2009 给出的 规则 起草。本标准 由 宁 波市 档案 局提 出和归 口。本标准 起草 单位:宁 波市 档案局、宁 波市 电子 文件 备份中 心、宁波 市大 数据 发展管 理局、浙江金网信息产 业股 份 有 限公 司、宁波 市 标准 化研 究院。本标准 主要 起草 人:詹锐、沈渊 飞、金雷、齐 力上、余兆 力、陈宏 晓、吴建 港、胡 一俊、薛 馨 枫、陈霄、李勤 东、徐亮、张 凯、王 霄翔、曾 祺惠、郭 辉、王 钢、王豪、潘 云峰。DB3302/T 1112 2019 政府 网站 网页归档 与管理 规范 1 范围 本标准 规定 了政府 网 站网 页 归档 与管 理的 总则,以 及采集、归 档、整理、移 交接收、保管 和 利用 等主要流 程的 具体 要求。本标准 适用 于政府 网 站网 页 的归档 和 管理,其它 类 型网站 网页 归档 可参 照 执 行。2 规范性 引用 文件 下列文 件对 于本 文件 的应 用是必 不可 少的。凡 是注 日期的 引用 文件,仅 所注 日期的 版本 适用 于 本 文件。凡 是不 注日 期的 引用 文件,其最 新版 本(包括 所有的 修改 单)适用 于本 文件。GB/T 18894-2016 电 子文 件归档 与电 子档 案管 理规 范 GB/T 32010.1 文献 管理 可移植 文档 格式 第1 部分:PDF 1.7 GB/T 33190 电 子文 件存 储 与交换 格式 版 式文 档 GB/T 33994 信 息和 文献 WARC 文 件格 式 DA/T 15 磁 性载 体档 案管 理与保 护规 范 DA/T 70-2018 文书 类电 子 档案检 测一 般要 求 3 术语、定义 和缩 略语 3.1 术语和 定义 下列术 语和 定义 适用 于本 文件。3.1.1 政府网 站 各级人 民政 府及 其部 门、派出机 构和 承担 行 政 职能 的事业 单位 在互 联网 上开 办的,具备 信息 发 布、解读回 应、办事 服务、互 动交流 等功 能的 网站。3.1.2 网页归 档 将 政府 机关 和企 事业 单位 通过网 站形 成的,对 国家 和社会 具有 保存 价值 的网 页、网 页附 件及 元 数 据进行采 集、整理、移 交接 收、保 管和 利用 的过 程。3.1.3 网页档案 政府 机 关和 企事 业单 位网 站形成 的,经归 档的 对国 家和社 会具 有保 存价 值的 网页、网页 附件 及 元 数据。3.1.4 网页归档 管理 系统 对网站 和网 页进 行采集、归档、整理、移 交接 收、保 管和 利用 的 电 子文 件管 理系统。3.2 缩略语 DB3302/T 1112 2019 下 列缩 略语 适用 于本 文件。OFD:开放 的版 式文 档(Open Fixed-layout Document)PDF:便携 式文 档格 式(Portable Document Format)URL:统一 资源 定位 系统(Uniform Resource Locator)WARC:互联 网存 档(Web ARChive File)4 总则 4.1 网站网 页归 档与 管理 主要 流程图 见图 1。政府 网站网 页归档 的主要 流程社会公众 网站主办单位 档案行政管理部门 国家综合 档案馆利用 采集 归档 保管采集移交 接收归档利用保管检测归档范围 与保管期 限表审核、备案整理保管 图1 网站 网页 归档 与管 理 主要流 程图 4.2 应充分 考虑 网页 文件 的特 点,在 采集、归 档、保管 和利用 等环 节采取 不 同的 安全管理 措施。4.3 网 页归档 管 理系 统 应 充分 吸收国 内外 网络 信息 资源 归档项 目的 成功 经验。DB3302/T 1112 2019 4.4 应 加强 相关 机构 之间 的 分 工与 合 作,应重 视网 页文 件涉及 的知 识产 权问 题。4.5 网站主 办单 位应 担负 网页 归档的 主体 责任,确 保 本 单位网 站中 对国 家和 社会 具有保 存价 值的 网页文件及 时归 档。5 采集 5.1 网站主 办单 位应 根据 本单 位网站 网页 内容 的实 际情 况,综 合分 析网 页信息 的 重 要程度 和保 存价 值,制定本 单位 网页 文件 的 归档范 围和 保管 期限 表,并提 交同 级档 案行 政管 理部门 审核 和备 案:a)归档范 围:应 综合 分析 网 页信息 的重 要程 度和 保存 价值,制 定本 单位 网页 信 息的归 档范 围。网页归档 范围 一般 应包 括反 映网站 整体 风貌 的网 站首 页、频 道首 页及 栏目 首页,反映本 单位职能和网站 功能 的信 息发 布类、解读 回应 类、办事 服务 类、互 动交 流类,以 及其 他具有 保存 价 值 的页面;b)保管期 限:网页 档案 的保 管期限 定为 永久、定期 30 年、定期 10 年三 种,应 以 网站栏 目为 单位设定保 管期 限,网站 栏目 的保管 期限 设定 为栏 目内 网页文 件的 最高 保管 期限。5.2 网站主 办单 位制 定网 页文件 的 归档 范围 和保 管期 限表 时,可参 考附录 A。5.3 网站主 办单 位 依 据 归档 范围与 保管 期限 表 采集 网站的 网页 文件 和内 部链 接,以 URL 链接 方式存在于 网页 文件 中的 文本、照片、音 频、视频 等附 件 及网 页文 件相 关元 数据,应同时 采 集。5.4 网站主 办单 位 采 集时,如 网 页文 件中 有较 大的 音频、视 频类 附件 导致WARC 文 件需分 割时,附件 应单独存 放。5.5 网站主 办单 位 采 集应 以符合 GB/T 33994 规定 的WARC 格式,或 符合GB/T 33190 规定 的OFD 格 式,或符 合GB/T 32010.1 规定的 PDF 格式 保存。5.6 网站 遇 整合 迁移、改 版等 情况,或网 上事 务办 理完 毕、栏 目频 道信 息重 大更 新、展 现 形 式发 生较大变化 时,网站 主办 单位 应及时 采集。5.7 网站主 办单 位宜 通过 采集 工具进 行采集,采集 应在 网站夜间 访 问低 峰时 段进行;网 站新 开发 建设或重大 改版 时,应考 虑集 成网页 档案 归档 功能。5.8 网站主 办单 位 应 使用 重复 信息 识 别技 术,对相同 URL 的网 页文件,仅 采集 一次。5.9 网页 采 集后,网 站主 办单 位 宜采 用 无 钥签 名、电子 签名、区块 链 等 技术 手段 来 保障 网页 档案 的真实性;电子 签名 宜通 过批 量一次 性签 名与 按件 签名 相结合 的手 段,降低 签名 成本。6 归档 6.1 归档要 求 6.1.1 网页文 件在 采集 完成 后,网站主 办单 位 应 当实 时归 档。6.1.2 网页归 档时 应将 网页 文件 的元数 据同 时归 档(归档 元数据 项 参 见附录 B),包括且 不限 于:内容检 索类;资源属 性类;知识产 权类;固化信 息类。6.1.3 对于有 附件 的网 页,归档 时 应将 附件 与网 页 同 时归 档。6.1.4 当网页 文件 因篇 幅较 长而 分为多 个页 面显 示时,应 将该 项 内容 所对 应的 多个 页面 同 时归 档。6.1.5 网站主 办单 位在 网页 归档 管理系 统 上 进行 归档 时,可采取 逻辑 归档 方式。6.1.6 对即将 关闭 的网 站或 即将 网站改 版 的 网站,网 站主 办单位 应进 行物 理归 档,将存储 的网 页档案进行备 份,并上 报网 站主 管单位 和档 案行 政管 理部 门。DB3302/T 1112 2019 6.2 检测要求 6.2.1 网站主 办单 位应 在采 集 时 对网页 文件 进行 文件 级的 真实性 和完 整性 检测,归 档时对 归档 包进 行可用性 和安 全性 检测,采 集和归 档时 的检 测应 分步 进行。6.2.2 网页档案 的 检测 内容 可参 照 DA/T 70-2018 执 行。检 测要求 主要 包括 对网页 档案 的真 实性、完整性、可 用性 和安 全性 进行 检测。6.2.3 网站主 办单 位 和 国家 综合 档案馆 应在 移交 接收 时、长久保 存时,分 别进 行 真 实性、完整 性、可用性和 安全 性 检 测。6.2.4 检测应 以 网 页归 档管 理系 统 自动 检测 为主,检 测主 要内容 包括 且不 限于:网站、频道 首页 内容;栏目数 量、栏目 内网 页数 量;网页文 件的 元数 据和 全文 特殊赋 值情 况,如空 值、最大值、异 常值 等。7 整理 7.1 网页文 件唯 一标 识符 7.1.1 网页文 件唯 一标 识符 应能 唯一表 示网 页文 件,字符 编码不 区分 大小 写,能扩 展为 数 字对 象唯 一标识符(DOI)。7.1.2 网页文 件 唯 一标 识符 的编 制结构 为“网站 编号-日期-保管 期限 代码-流水 号”:网站编 号:为10 位数 字,前2 位 为省 级 行 政区 划码,后 8 位数 字为 网站 主办 单位的ICP 备案号中 的8 位 数字;日期:为网 页文 件 WARC 格式 采集 时间,以8 位 数字 表示的 年月 日;保管期 限代码:“永久”用“Y”表 示,“定期30 年”用“D30”表 示,“定期10 年”用“D10”表示;流水号:为 网页 文件 采集 时的流 水编 号,采 用 6 位 数字编 码,从“000001”起。7.2 档号 7.2.1 网页档 案应 以网 页文 件唯 一标识 符为 基础 生成 档号。7.2.2 档号的 结构 宜为“全 宗号-WY.年度-网 页文 件唯 一标 识符”。7.3 保存结 构 7.3.1 网页档 案可 采用 层级 文件 夹的形 式进 行存 储,在“网页档 案”总文 件夹 下,根据保 存格 式的 不同分别 采取 不同 的层 级结 构。7.3.2 以WARC 格 式保 存的 网页 档 案,依 次按 不同 的网 站、年度建 立层 级文 件夹,如“网 页档 案宁波档案网2018”。7.3.3 以非WARC 格式 保存 的网 页 档案,应符 合 GB/T 18894-2016 规定 的保 存要 求。8 移交接收 8.1 网页档 案 由 网站 主办 单位 向同级 国家 综合 档案 馆办 理移交 手续。8.2 网站主 办单 位 应 自网页 档 案形成 之日 起5 年内 移交 给同级 国家 综合 档案 馆。8.3 如遇网 站重 大改 版,网站 主办单 位 应 在改 版后 及时 进行移 交。8.4 网站主 办 单 位应 当将 已移 交的网页 档 案在 本单 位至 少保 存 5 年。DB3302/T 1112 2019 9 保管 和 利用 9.1 保管 9.1.1 网站主 办单 位 应 维护 一个 与 WARC 文 件一 致的 网页 文 件元数 据数 据结 构快 照,并进行 保存。9.1.2 保存 为OFD 文件 格式 的网 页档案,应 将网 页文 件中 的图片、视 频、音频 等附 件 单独 另 存,其 保存方式 应符合 GB/T 33190 的要求。9.1.3 网站主 办单 位 应 合理 设计 网页文 件的 分层 存储 结构 和 WARC 的 大小,支 持第 三 方备份 软件 进行 备份。9.1.4 网页档 案应 采用 在线 和离线 二种 方式 分别 保存。9.1.5 离线存 储在 磁性 载体 上的 网页档 案 按 DA/T 15 的要 求 进行 保管。9.2 利用 9.2.1 除涉及 知识 产权、个 人隐 私 等问题 外的 所有 网页 档案 均应在 互联 网上 向社 会公 众 提供 利用 服务。9.2.2 应提 供URL、全文、元 数 据等检 索 功 能。9.2.3 应提供 按时 间、主题、专 业等分 类展 示功 能。9.2.4 应提供 以OFD、PDF 格式 的 网页版 式电 子文 件输出 功 能。9.3 处置 9.3.1 国家综 合档 案馆 应定 期对 网页档 案进 行销 毁鉴 定,鉴定程 序应 符合 国家 有关 规定。9.3.2 国家综 合档 案馆 应在 确保 网页档 案的 真实 性、完整 性、可 用性 和安 全性 基础 上,实 施网 页档 案及其元 数据 的迁 移。9.3.3 对于定期 10 年、定期 30 年到期 的网 页档 案 应 参照 国家关 于档 案销 毁的 有关 规定与 程序 执行,具体要 求如 下:a)以时间 轴、栏目 为单 位对 电子档 案内 容进 行销 毁鉴 定,如 网页 档案 内容 没有 继续保 存价 值 的,可进行 批量 销毁;b)根据网 页档 案的 技术 状态 检测、依 赖环 境保 存状 态 检测、病 毒检 测结 果,对 不 可用或 嵌入 了病毒、木 马代 码的 电子 文件 可进行 销毁;c)应销毁 的网 页档 案可 在保 存成本 增加 或迁 移前 进行 集中销 毁。DB3302/T 1112 2019 1)附 录 A(资料 性附 录)归档范 围与 保管 期限 网页文件 的 归档 范围 和保 管期限 见表A.1。表A.1 归档范 围和 保管 期限 表 序号 归 档 范 围 保管期限 1 网站、频道、专题等首页页面 永久 2 本地区、本部门出台的 地方性法规、政府规章和行政规范性文件 永久 3 本地区、本部门出台的国民经济和社会发展规划、专项规划、区域规划及相关政策信息 永久 4 本地区、本部门、本机 构的国民经济和社会发展统计信息 永久 5 本地区、本部门、本机构的财政预算、决算报告 永久 6 行政事业性收费的项目、依据、标准信息 永久 7 政府集中采购项目的目录、标准及实施情况信息 机构设置、主要职责和联系方式等机构职能信息 永久 8 行政许可的事项、依据、条件、数量、程序、期限以及申请 行政许可需要提交的全部材料目录及办理情况信息 永久 9 重大建设项目的批准和实施情况信息 永久 10 扶贫、教育、医疗、社会保障、促进就业等方面的政策、措施及其实施情况信息 永久 11 突发公共事件的应急预案、预警信息及应对情况信息 永久 12 环境保护、公共卫生、安全生产、食品药品、产品质量的监督检查情况信息 永久 13 涉及城乡建设和管理的重大事项的专题信息 永久 14 社会公益事业建设情况的专题信息 永久 15 征收或者征用土地、房屋拆迁及其补偿、补助费用的发放、使用情况 永久 16 抢险救灾、优抚、救济、社会捐助等款物的管理、使用和分配情况 永久 17 涉及公民、法人或者其他组织切身利益的信息 永久 18 需要社会公众广泛知晓或者参与的信息 永久 19 反映本行政机关机构设置、职能、办事程序等情况的信息 永久 20 通知公告、发布、公示类信息 永久 21 由文件制发部门、牵头或起草部门提供的重要政策文件的解读材料,包括各种形式的解读、评论、专访等 永久 22 涉及本地区、本部门的重大事件、热点问题的专题信息 永久 23 非咨询类栏目的科技、技术 信息 永久 23 本地区、本部门政务要闻、工作动态等信息 30 年 24 网民意见建议和问题咨询的审看、处理和反馈信息 30 年 25 开展专项意见建议征集活动并在网站上公布采用情况的信息 30 年 26 针对近期社会热点和本部门重点 工作开展访谈活动的音视频、图片、文字记录等信息 30 年 27 本地区、本部门、本机构的负责人重要讲话文稿 30 年 DB3302/T 1112 2019 2)附 录 B(资料 性附 录)网页文 件归 档元 数据 网页文 件归 档元 数据 见表B.1。表B.1 网页文 件归 档元 数据 编号 分类 元数据名称 英文名称 约束性 数据类型 备注 M1 内容检索类 标题 ArticleTitle 必选 字符型 M2 发布时间 PubDate 必选 日期型 8 位数字 M3 来源 ContentSource 必选 字符型 M4 关键词 Keywords 可选 字符型 M5 摘要 Description 可选 字符型 M6 网址 Url 必选 字符型 M7 资源属性类 采集时间 ColDate 必选 日期型 8 位数字 M8 语种 Language 可选 字符型 GB2312/UTF-8 等 M9 类型 Type 必选 字符型 M10 格式 Format 必选 字符型 M11 唯一标识符 Identifier 必选 字符型 M12 知识产权类 作者 Creator 必选 字符型 M13 发表者 Publisher 可选 字符型 M14 贡献者 Contributor 可选 字符型 M15 权利所有者 Rights 可选 字符型 M16 固化信息类 数字摘要 DigitalDigest 必选 字符型 M17 校验信息 CheckInfo 必选 字符型 _
展开阅读全文