互联网资源的价值已经为世界各国所公认,由于其易逝性的特点,对其进行保护已迫在眉睫,对中文互联网资源的保存与保护,是进一步促进互联网资源整合,深入挖掘互联网信息价值的重要先行手段。
政府网站资源典藏平台的资源保存与保护是基于广泛应用的WARC网络存档格式,WARC格式具有软件生态环境完善、内容丰富、便于管理、易于扩展、支持大容量文件保存,适合网络资源和数字资源的长期保存使用。政府网站资源典藏平台对互联网资源尤其以政府类中文互联网资源为保存目标,全面采集站点的文本内容、信息图片、信息附件、Web样式、互链关系等,按照WARC存档规范进行数据整理及格式转换,实现互联网资源的标准、有序、无损保存。
政府网站资源典藏平台致力于推动政府类网络资源保存保护的技术发展和保护力度,通过WARC资源存档方式不定期的对目标站点资源进行保存与保护,并按照资源日期、数据容量、资源来源等进行分类索引,并通过格式还原将WARC资源进行原样还原,向广大用户呈现不同时间点的页面形态及网络资源内容。
政府网站资源典藏平台将对本行政区内的所有政府类网站资源进行资源保存,并依照时间点进行资源分类,用户可按照政府机构名称、资源保存时间等对历史资源进行浏览及检索查阅。