【业务交流】“一网通办”背景下网页归档工作问题研究
2019-05-30 来源: 中国档案杂志 【字体:   打印

  在“一网通办”的背景下,政府网站的职能发生了转变,网站成为政府信息发布和对外服务的重要窗口,形成了大量具有凭证和查考价值的网页内容,成为了企业民众申办政务服务事项的重要场所、政务服务信息发布的重要渠道、阳光政务信息的重要披露场所、政府和民众交流的重要途径。在此背景下,归档网页是民众享受政务服务的原始记录,是政府部门履职的证明,是政务服务信息的集中载体,是政府执政能力和服务意识不断提高的见证。因此,网页归档工作在“一网通办”背景下变得更加重要和迫切,需要我们抓住重点,确定网页归档范围,梳理网页归档流程,研究和选择合适的网页归档技术手段,来推动网页归档工作。国家档案局计划通过印发国家层面网页归档相关办法,制定网页归档行业标准,试点建设网页归档系统平台等途径,从顶层推动政府网站的网页归档工作,为“一网通办”政务服务改革提供档案方面的支持。

  政府网站的职能转变

  继2016年发布《关于加快推进“互联网+政务服务”工作的指导意见》(国发〔2016〕55号)后,2018年国务院又发布了《进一步深化“互联网+政务服务” 推进政务服务“一网、一门、一次”改革实施方案》(国办发〔2018〕45号),加快推进全国范围内政务服务“一网通办”改革的进程。“一网通办”背景下,各省市都在积极推进一体化的政务服务网站平台建设,政府网站发展十分迅速,目前全国正在运行的政府网站超过2万家,2017年通过政府网站发布的政府信息达到3.45亿条、发布政策解读86万余篇、回应公众关切100万余次,大量的政务服务事项逐渐从“线下”转到“线上”,政府网站的职能也相应发生了转变。

  1.政府网站成为企业和民众申办政务服务事项的重要场所

  “一网通办”背景下,企业和民众办理的很多政务服务事项,从咨询、申报到预审、办理及结果反馈,都可以在一体化的政务服务平台上全程在线办理,网站已经成为企业和民众申办政务服务事项的重要场所。

  2.网站成为政务服务信息发布的重要渠道

  “一网通办”背景下,政府部门更多地通过网站发布各类政务服务信息,如设立变更、准营准办、资质认证、招标拍卖、规划建设等,一方面为企业和民众提供便捷的信息查询服务,另一方面也有利于提高政府部门的服务效率。

  3.网站成为阳光政务信息的重要披露场所

  “一网通办”背景下,政府部门将各项阳光政务信息,如政务服务事项清单、办理流程、办理时限、收费标准等在网站上全面公开,接受全社会的监督,有利于推进廉洁政府、阳光政府建设,政府网站成为阳光政务信息的重要披露场所。

  4.网站成为政府和民众交流的重要途径

  “一网通办”背景下,政府网站常常设置留言板、咨询栏、意见箱、投票箱等功能栏目,提供更为便捷、多样化的企业和民众与政府进行信息沟通的渠道,方便企业和群众进行信息咨询、意见反馈、业务交流等,成为政府与民众沟通交流的重要途径。

  网页归档工作的重要意义

  国务院发布的《政府网站发展指引》(国办发〔2017〕47号)明确提出要做好网页归档工作。随着“一网通办”背景下政府网站的职能转变,网页归档在新时代背景下将发挥其重要作用。

  1.网页是民众享受政务服务的原始记录

  “一网通办”背景下政务服务事项的办理过程中,咨询交流、服务预约、在线申请、结果反馈等过程,都是通过网页的形式进行展现、传输和记录的,因此,网页是民众享受政务服务的第一手资料,网页归档是政务服务事项办理的“最后一公里”,具有重要的凭证价值。

  2.网页是政府部门依法履职的证明

  “一网通办”背景下,政务服务的整个流程都是公开透明的,政府部门是否按要求进行了信息公示,是否及时反馈了民众的服务要求,是否对重要突发情况进行了第一时间回应等,都可以通过网页归档来记录和证明。

  3.网页是政务服务信息的集中载体

  政府网站具有信息发布、解读回应、办事服务和互动交流等多种功能,政府网站的网页记载着大量的政务服务信息,是政务服务信息的集中载体,有必要进行妥善归档保存。

  4.网页是政府执政能力和服务意识不断提高的见证

  以往,很多政务服务事项只能通过政务大厅的服务窗口现场办理,企业和民众常常需要多次往返,效率不高。“一网通办”背景下,大量政务服务事项可以全流程通过网络在线办理,让企业和民众办事更方便、更快捷,大幅提升了政府执政能力和服务水平,而网页正是见证这一过程的重要记录,具有很高的归档保存价值。

  因此,将具有保存价值的政府网站网页及时予以归档,是档案工作在“一网通办”背景下的必要延伸,也是时代赋予档案工作新的历史使命。

  网页归档工作现状和问题分析

  1.国际及国内网页归档工作现状

  早在20世纪90年代中期,国际上已经开始了关于网络资源保存的讨论,而网页归档作为网络信息资源保存的重要方法,一直被各个国家重点研究和探索。最早开展网页归档实践的机构有美国互联网档案馆、英国国家档案馆、澳大利亚国家图书馆等,此后法国、荷兰、加拿大、韩国、日本等国家纷纷开始其网页归档实践。2003年,IIPC(国际互联网保存联盟)成立,截至2018年4月,共有54个成员机构,包括各大档案馆、图书馆、研究所、公司等,涵盖了世界上绝大多数高水平的网页归档项目研究机构,据不完全统计,IIPC下的成员机构成功实施的网页归档项目超过80个,归档保存了大量的网络信息资源。相比之下,我国政府网站的网页归档工作尚处在起步阶段。目前,在国内档案部门中,仅有青岛市档案馆、郑州市档案馆等少数几家开展了网页归档的试点工作,归档的网页数量较少,也没有建立起一套完整的收集、保管、利用的管理体系。

  在网页归档的法规制度方面,欧美国家起步较早。加拿大在2004年就制定了《图书档案法案》,允许网页归档,并将归档范围扩展到在线出版物,为网页归档主体的行为提供了法律保障。美国出台的《社交媒体文件捕获最佳实践白皮书》、英国出台的《政府Web存档:重新定义政府部门技术指导》等,对网页归档实践提出了更加明确的行为指导。目前,网页归档有立法保障的国家还有法国、西班牙、瑞典、丹麦、挪威、日本等。我国也先后出台了一些网页归档相关政策。《政府网站发展指引》(国办发〔2017〕47号)要求:“政府网站遇整合迁移、改版等情况,要对有价值的原网页进行归档处理。归档后的页面要能正常访问,并在显著位置清晰注明‘已归档’和归档时间。”国家档案局在《全国档案事业发展“十三五”规划纲要》中指出,要研究制定重要网页资源的采集和社交媒体文件的归档管理办法。这些相关政策的出台对于网页归档工作的开展起到了引导和促进作用。

  2.我国网页归档工作面临的问题

  (1)相关法律问题

  目前,我国的网页归档还缺乏相关法律法规的支持。网页归档工作的开展,需要严格遵从法律法规,尊重及维护网页涉及的知识产权和其他合法权益。2006年5月颁布的《信息网络传播权保护条例》,具体规定了信息在网络传播过程中著作权人与发布者、传播者、利用者的相关权益,法律虽然认可网页的证据价值,但是没有明确赋予档案部门拥有网页资源采集、保存和公布利用的权力。同时,网页归档可能会涉及公民的隐私,网页中可能包含涉及公民个人隐私的信息,这在网页归档时如何合理处理仍然是一个难点。

  (2)归档范围和保管期限问题

  目前,对于网页归档的范围和保管期限还没有出台明确的标准。政府网站的栏目和页面情况比较复杂,并非所有的网页文件都具有保存价值,有必要按照网页内容的价值来判定网页的归档范围和保管期限,对其中有价值的网页进行归档处理,而不应不加区别地全部归档。

  (3)归档的技术问题

  网页归档是一个系统工程,涉及网页采集、保存等多方面的技术问题,仍有待研究。例如,在网页采集方面,是从客户端启动网页爬虫来模拟浏览器采集网页,还是通过网站后台维护系统直接采集发布的网页?是网站主办单位主动将网页呈缴到保存机构,还是保存机构主动选择式或广泛式地采集网页信息资源? 又如,网页的保存,虽然参考ISO 28500发布的《GB/T 33994—2017信息和文献WARC文件格式》,引入了网页归档WARC格式,但该格式在使用的便利性上和长久保存之后的可用性上仍然可能存在局限性。

  网页归档工作的重点

  “一网通办”背景下,为发挥好网页作为政务服务记录和政府部门履职凭证的作用,应抓住如下重点大力推进网页归档工作:

  1.确定网页归档范围和保管期限

  “一网通办”背景下,网站主办单位应根据实际情况,制定本网站网页归档范围和保管期限表。需要重点关注和归档的网页是通过网站形成和处理而其他地方没有的,记录政务服务信息和反映政府部门履职状况的网页。例如,信息发布类网页中,应重点归档与企业和民众切身利益密切相关的、时效性强的信息发布和公示网页,包括信息公开目录、机构职能、法律规章等,这类信息内容相对稳定,重要性强,宜永久或长期保存,通过归档这类网页,形成政府部门按要求及时进行信息公示的履职证明。又如,办事服务类网页中,虽然主要的服务过程可能在政府网站链接的后台业务系统中完成,但是如果与服务对象的交互仍然主要体现为网页形式,譬如服务信息的发布、服务的网上预约、服务申请的提交、服务进度的显示和服务结果的反馈等,则需要考虑归档这一类网页以形成政务服务记录的重要组成部分,保管期限宜定为永久或长期保存。

  2.确定网页采集归档时间

  “一网通办”背景下,在遇到网站迁移、改版、下线等重大变动时,需要对具有保存价值的网页进行比较全面的归档处理。另外,在网站正常运行过程中,对于具有查考和保存价值的网页,也应当及时采集归档。例如,对信息发布类网页,应在网页发布时或更新时进行采集归档;对办事服务类页面,应在办理的关键节点进行采集归档。

  3.明确归档内容及归档要求

  “一网通办”背景下,网页归档要最大限度保留网页特征,使归档后的页面能正常访问,具有真实、完整、可用、安全性。一个网页的内容可能包括文本、图片、音频、视频、链接,要根据目前的采集技术和保存手段明确是否需要对以上内容全部采集归档。对于网上审批等政务服务事项,其网上申报和结果反馈页面往往是动态网页,页面内容依赖于用户输入和后台数据库,还可能有一些附件信息,这些内容都应得到有效归档。同时,还需要归档网页标题、发布时间、网址等元数据信息。

  4.梳理网页归档流程

  “一网通办”背景下,网页归档作为政务服务原始记录和政府机构履职证明材料,应遵循“谁形成办理谁归档”的原则,注重归档过程的严谨性和归档材料的凭证价值。以往图书界主导的网站网页归档保存研究中,多数是由图书馆自行使用网络爬虫形式抓取和保存目标网站和网页,这种方式更多的关注点在于网页的信息价值,而凭证价值存在瑕疵。“一网通办”背景下的网页归档不宜采用这种保存机构自行抓取网页保存的形式,而应采用更为严谨的“网站管理部门收集整理归档—档案部门集中管理和保存”的两段式归档和保存流程(其中第二段又可以细分为“档案室阶段性保存”和“档案馆永久保存”两个阶段)。通过不同部门之间的分工和协作,划分清楚各自的权力和责任,网站管理部门为归档网页的可靠性负责,档案部门为归档网页的真实性负责,这样可以更好地保障归档网页的凭证价值,为“一网通办”背景下的政务服务和政府部门履职提供档案支持。

  5.研究和选择合适的技术手段

  “一网通办”背景下,需要选择合适的技术手段来保障归档网页的真实性、完整性和可用性。归档网页真实性保障可以参考归档电子文件的真实性保障,选用数字摘要、数字签名或可信时间戳等技术来实现。归档网页完整性保障则要分析在网页本身之外还有哪些信息需要收集和保存,例如为了反映信息发布这一职能,需要收集网页发布时的网络地址和网页发布的时间段;又如对于带有链接的网页,需要研究链接指向的内容如何收集和保存等。

  网页归档的可用性保障问题相对复杂。通常各类网页格式如静态的html、shtml或动态的cgi、asp、aspx、php、jsp等,在不同时期或不同版本的浏览器上会出现显示的差异,因此不能确实保障长期保存过程中的可用性。网站存档格式WARC虽然已经在国际上广泛使用,并采标为GB/T 33994—2017,但由于其内核基于html,因此在长期保存过程的可用性问题仍需要进行研究和探讨。还有一种思路是将网页转化为版式文件格式(如OFD格式)保存,这样在可用性保障上有所提升,但是静态的版式格式会损失动态网页的一些内容,因此这种方法有其局限性。总之,在网页归档的可用性保障上,目前没有特别完善的解决方案,但可以考虑在目前的技术条件下先将网页归档工作开展起来,把可用性保障问题留到技术发展之后再予以解决。

  下一步工作计划

  “一网通办”背景下,国家档案局计划从以下几个方面来推进网页归档工作:

  1.印发国家层面网页归档相关办法

  全面贯彻落实《全国档案事业发展“十三五”规划纲要》的要求,统筹规划网站网页归档工作,加快推进《政府网站网页归档管理办法》的出台。《政府网站网页归档管理办法》将对政府网站网页归档的职责分工、归档范围、归档流程、归档要求以及归档网页如何保管利用等提出纲领性的要求,为全国各级政府部门开展政府网站网页归档工作提供政策依据,推进建立政府网站网页归档工作长效机制,保障和提升政府网站在政府治理与公共服务中的作用。

  2.制定网页归档行业标准

  网页归档需要相关标准规范的支撑,国家档案局正在研究制定网页归档的行业标准《网站网页归档指南》,标准内容涵盖网页归档的总体要求,归档范围和保管期限、归档流程、归档技术要求及归档软件功能要求等内容,为各级政府部门开展网页归档工作提供规范指导,推进我国政府网站网页归档工作的有序开展。

  3.建设网页归档系统平台

  网页归档工作的开展需要计算机应用系统的支撑。国家档案局正在推进网页归档系统平台的试点工作,通过试点单位网页归档功能的开发和建设,实现政府网站网页信息的采集归档,并采用相关的技术手段保障归档网页的真实性、完整性和可用性。通过网页归档系统平台试点建设,验证相关法规政策和标准规范的可行性,并为后续各级政府部门网页归档系统功能的开发提供示范性应用

   作者单位:国家档案局
   文章来源:《中国档案》2019年第1期