区块链:区块链与档案界的共同愿景:信任构建

作者:何思源

摘要:数字时代和网络空间,现有的档案信任体系受到了前所未有的冲击与挑战,区块链的出现为构建更为坚实的基于数字技术的信任机制提供了契机。本文将信任构建作为档案界与区块链的共同愿景,将可信数字档案的基本属性归纳为真实性、可靠性、完整性、齐全性和可用性,分别阐述区块链和档案学方法的信任构建逻辑及其互补性,参照5W1H的基本框架,从上链范围、应用场景、上链时机、参与节点、技术选型等维度重点探讨区块链应用于档案可信性保障的关键问题,并提出未来的发展策略。

关键词:区块链;数字档案;可信性;真实性;信任

信任是人类社会的基本议题。档案作为人类社会活动的原始记录,既是业务凭证,也是法律证据。档案工作正是通过捍卫档案的真实、建立对档案的信任,才能发挥其在业务查考、决策支持、研究教育等领域的作用,进而维持组织机构乃至人类社会的良性运转。但在数字时代和网络空间,现有的档案信任体系受到了前所未有的冲击与挑战,区块链的出现为构建更为坚实的基于数字技术的信任机制提供了契机。本文将信任构建作为档案界与区块链的共同愿景,在界定“可信数字档案”的基础上,阐述二者的信任构建逻辑及其互补性,重点探讨区块链应用于档案可信性保障的关键问题与发展策略。

可信数字档案

在国际档案界,建立对数字档案的信任主要有两种理论逻辑,一种是保障数字档案本身的可信性,一种是通过维护信息系统的安全可靠建立对数字档案的信任。对主要采用第一种思路的中国而言,如何理解和诠释可信性成为关键。纵观国内外理论与实践成果,有两个最具影响力的流派,一是国际标准《信息与文献—文件管理 第一部分:概念与原则》(ISO 15489-1: 2016)提出的“四性说”,即可信数字档案需要满足真实性(Authenticity)、可靠性(Reliability)、完整性(Integrity)、可用性(Useability);二是InterPARES项目提出的“三性说”,即可信性包括可靠性(Reliability)、真实性(Authenticity)、准确性(Accuracy)。虽然二者使用的部分术语相同,但含义存在差异。中共中央办公厅和国务院办公厅联合印发的《电子文件管理暂行办法》主要借鉴ISO 15489的观点,并将其修改为真实性(Authenticity)、完整性(Integrity)、可用性(Useability)和安全性(Security)。由于《电子文件管理暂行办法》中的安全性与完整性存在概念交叉且安全性本身的边界模糊、不易界定,本文基本采纳ISO 15489的原始表述,但由于其完整性具有双重含义,为便于表达、避免歧义,将其拆为完整性(Integrity)和齐全性(Completeness),如表1所示。

区块链与档案界的信任构建逻辑

(一)区块链的信任构建逻辑

区块链(Blockchain)是一种由多方共同维护,使用密码学保证传输和访问安全,能够实现数据一致存储、难以篡改、防止抵赖的分布式账本技术。它不是一种独立的信息技术,而是数字摘要、数字签名、可信时间戳、非对称加密、分布式数据库等技术的组合应用,主要通过建立在密码学基础上的技术逻辑实现信任构建,尤为适用于弱信任环境下的多主体协作。其不可篡改性、可追溯性、抗抵赖性与档案可信性之间存在天然联系,主要涉及四个方面:

其一,区块链的数据存储结构是按时间顺序排列的块链式数据结构,区块间通过哈希指针形成“环环相扣”“层层嵌套”的链式结构。

其二,区块链与传统数据库的增删改查等常规操作不同,只有新增和查询操作,没有删除和修改操作(删改均需通过新增实现),所有操作都以日志形式完整记录。

其三,区块链的本质是分布式数据库,依赖P2P网络,多节点通过共识机制共同维护、验证数据。

其四,数字签名能为主体身份认证提供证据。其中,去中心化、块链式结构和数据操作限制使其具有不可篡改性;时序排列使其具有可追溯性;数字签名使其具有抗抵赖性。

(二)档案界的信任构建逻辑

在传统环境中,对档案的信任依赖于对档案机构及档案工作者职业道德的信任。在人类社会发展的早期阶段,存贮档案的场所通常具有神圣性,例如西方的神庙和中国西周时期的天府。在此阶段,人们借助机构的神圣性实现对档案的信任。但在数字时代,档案机构面临着严重的信任危机。一方面,数字档案具有载体和信息可分离性、易变性等特点;另一方面,随着后现代的兴起,档案概念呈现出“泛化”趋势,越来越多的非传统、非官方的档案资源进入公众视野,例如社交媒体档案、网页档案、私人档案、社群档案等,权威性不再是档案资源的固有属性。此外,随着后真相时代的到来,官方机构的公信力受到质疑,加之网络上关于档案篡改的新闻层出不穷,尤其是审计、纪检监察、司法诉讼、税务稽查等特定场景下,传统的档案信任机制无法有效运转。

为构建适应数字环境的档案信任机制,档案界展开了三十余年的探索与实践。在真实性、可靠性和完整性保障方面,已经形成基于管理与技术双重逻辑的信任体系。其中,管理维度涉及制度规范和业务操作两个层面,在制度规范层,需要建立规范的流程和要求,包括前端控制和全程管理;在业务操作层,需要对档案形成至销毁或永久保存的全生命周期管理进行元数据著录,定期对数字档案进行检测。技术维度主要有用户身份识别、权限控制、数字摘要、数字签名、可信时间戳等。其中,最具档案特色的是全程元数据著录,即基于背景关系的信任构建逻辑,尤以国际标准《信息和文献.记录管理过程.记录用元数据.第1部分:原则》(ISO 23081-1-2017)提出的文件管理元数据模型最为典型。该模型包括文件、业务、责任者、法规标准和关系五类实体,我国也据此制定了面向文书、照片、声像等不同门类档案的元数据方案,旨在通过呈现档案与其业务背景间的关系构建档案信任体系。在齐全性保障层面,系统研究了数字档案的构成要素,形成了三要素、四要素、五要素等不同理论流派,目前得到广泛认可的是由内容、结构、背景构成的三要素。在可用性保障层面,形成了以OAIS参考模型为框架,以保存规划与管理方案为支撑,以格式管理、更新、复制、仿真、迁移、封装等策略为核心的保障体系。

(三)区块链与档案学方法的相辅相成

如果将区块链的可信性维护能力映射到前文提出的可信数字档案基本属性中,可发现区块链虽然能解决真实性和完整性问题,但却无法解决所有的信任问题。例如,区块链无法确保档案的内容与客观事实相符,即无法解决数据上链前的内容真实问题(即可靠性问题)。而现有的档案学方法虽然较为全面、系统地解决了可信性问题,但在实际操作过程中,数字签名等技术通常依赖于特定的认证机构(如CA机构)。我国有40多家不同的CA,第一,不一定所有的单位都使用CA;第二,不同单位可能使用不同的CA;第三,同一单位内部也可能使用不同的CA;第四,不同CA间无法实现互信互认,从而影响真实性保障效果。而区块链恰好可以弥补依赖特定认证机构的电子签名等方案的不足,因此,可将区块链作为档案可信性保障的一种技术手段。

综上,在区块链应用场景中,档案学方法(尤其是背景关系维护)能帮助其更好地实现数据可信的目标,为其提供更完整的信任构建思路;与此同时,区块链也可以作为一种技术要素嵌入档案信任机制,与现有的管理策略和技术方法融合,实现优势互补,构建更完善的档案信任基础设施。本文接下来将以后者为重点,对基于区块链的档案可信性保障展开探讨。

区块链应用于档案可信性保障的关键问题

区块链与档案界在信任构建方面具有天然的契合性,档案界早在2015年就开始探索区块链在档案管理领域的应用。美国、英国、加拿大、中国、韩国、印度、鞑靼斯坦共和国、伊朗、吉尔吉斯斯坦、博茨瓦纳、津巴布韦等国高度重视区块链在本国档案领域的应用。在新技术持续迭代的时代,区块链应用的首要原则是坚持业务导向,以需求引导应用,有针对性地解决业务实践中的痛点与难点问题,避免出现盲目追逐技术热点、“为用链而用链”的现象。本文将参照5W1H框架提出应用过程中需解决的关键问题,由于Why的问题前面已有所涉及,在此不再赘述。

(一)上链范围(What)

档案工作者首先需要思考哪些类型的档案需要上链、哪些类型的档案不能上链。就前者而言,需要考虑区块链的适用性问题,尤其是“多主体”和“弱信任”两个因素。中国人民大学信息资源管理学院刘越男教授认为,有三类档案尤为适合应用区块链,一是需要跨机构形成或处理的文件,例如合同、招投标文件、工程建设项目档案、供应链档案等;二是需要外部调用的文件,例如会计档案等财务类档案;三是需要跨机构共享利用的凭证文件,例如电子证照、电子学籍等业务凭证及婚姻档案等民生档案。就后者而言,需系统考虑区块链不可删改、去中心化等特点带来的风险。目前来看,出于安全考虑,涉密档案不适合上链;含有大量个人敏感信息的档案、到期需要处置的档案是否可以上链还有待考量。尤其是需要到期处置的档案,区块链通过销毁私钥的方式实现数据销毁是否能为档案界接受仍需探讨。

(二)应用场景(Where)

区块链在档案可信性保障中的核心应用场景是加强数字档案凭证能力和支持数字档案共享利用。第一种场景可从两个角度进行细分:一是从生命周期角度来看,在形成机构阶段,可维护数字档案在组织机构内部从形成到销毁或移交的真实性和完整性,为我国大力推进的电子文件单套制归档和单轨制管理提供了技术保障。企业档案馆(室)展开的实践探索多为此类,例如,中国石油化工集团有限公司(简称“中石化”)、中国电力建设集团有限公司(简称“中国电建”)、上海证券交易所等单位的档案区块链项目。在档案馆阶段,可维护数字档案在长期保存过程中的真实性和完整性,夯实数字档案馆的信任基础,例如,英国国家档案馆的ARCHANGEL项目、InterPARES项目欧洲团队提出的TrustChain模型/项目。二是从应用深度来看,既可以将区块链视作辅助性的可信性保障手段,将其作为叠加在现有档案管理系统上的一种技术,旨在实现真实性和完整性验证、全流程追溯,我国的项目及英国国家档案馆、InterPARES项目的案例均属此类;也可以将其作为档案管理系统的底层基础设施,以期在可信性保障的基础上发挥区块链的更多价值(如智能合约驱动的业务流程自动化),例如美国特拉华州公共档案馆的Smart Records(智能文件)项目。第二种场景既包括档案机构内部的共享、档案部门间的共享,也包括档案部门与其他部门间的共享,沈阳市档案馆、中国科学院合肥物质科学研究所开展的区块链项目均属此类。典型场景之一就是民生档案跨馆出证,传统环境下,不同地区的档案馆、办事机构、社区服务中心等机构之间无法建立充分的信任关系,但区块链的技术原理可以更好地解决跨机构信任问题,实现信任驱动共享。

(三)上链时机(When)

区块链的技术特性能够确保上链后的档案未经非法篡改且可追溯,但其局限性也非常明显,无法保证上链前的档案可信性,因此,上链时机就显得尤为重要。从理论上讲,上链时间越早越有利于实现档案可信,最理想的状态是从档案形成阶段开始上链。但现实情况下还要考虑实际的业务需求和场景。从发展现状来看,上链时机向前延伸可能会成为一种趋势。在档案界的早期探索中,一些档案部门从归档阶段开始实施上链,使其面临着如何解释归档前档案可信性的问题。虽然这一问题在传统环境中就已存在,但人们对区块链给予“厚望”,希望借助新技术推动前端控制的落地,因此,越来越多的档案部门(尤其是企业档案部门)与前端业务部门展开合作,逐步推动从形成阶段开始上链,覆盖档案的形成、办理、整理、归档、著录、保管、查询、处置等关键业务环节。

(四)参与节点(Who)

按照区块链系统是否具有节点准入机制,可将其分为许可链与非许可链(即为公有链),许可链可进一步分为私有链和联盟链。对档案机构来说,由于档案信息较为敏感,需在综合考虑安全保密、系统效率(如共识算法的效率)等因素的基础上,在去中心化和中心化之间寻求一种平衡,因此现阶段主要采用的是许可链。在理论层面,相关学者设计的理论模型多以联盟链为主。在实践层面,部分档案机构在起步阶段采用私有链,随着经验的积累,逐步扩展外部节点,将私有链转为联盟链。私有链的优势在于节点位于单一机构内部,较为容易部署实施,但无法实现跨机构的信任;而联盟链能较好地在安全可控和跨机构信任之间实现平衡,因而受到多数档案机构的青睐。例如,中石化在2018年的初步探索期,在公司内部选取北京、南京、东营、武汉、广州五个节点搭建私有链,在此基础上吸纳北京市档案局、中国人民大学电子文件管理研究中心、化工学会档案分会、中国标准化研究院标新司法鉴定所、档案系统开发厂商等外部节点加入,将其扩展为联盟链。

(五)技术选型(How)

技术选型涉及系统架构、区块结构、共识算法等。在系统架构方面,国内外档案机构大多基于Linux基金会的开源项目超级账本Hyperledger Fabric进行区块链系统的开发、部署和实施。

在区块结构方面,需要考虑档案的存储策略,即将哪些数据实际存储在区块链中。综合加拿大不列颠哥伦比亚大学(UBC)Victoria Louise Lemieux和我国国家档案局蔡盈芳的观点,可将档案在区块链中的存储模式分为四种类型:一是哈希上链,即仅有档案的哈希值上链;二是元数据上链,即档案的哈希值和部分元数据上链,至于具体选择哪些元数据则视业务需要而定;三是内容上链,即档案本身及元数据和哈希值上链;四是资产上链,除档案本身及其元数据和哈希值上链外,档案所记载的资产(如土地、珠宝等)被编码为凭据(或译为通证、代币)也上链。在应用过程中,应统筹考虑业务需求、安全保密与隐私保护要求、成本(如数据库运行压力、算力消耗、节能减排)等因素,合理选择相应的存储模式。目前,我国档案机构主要采取链上链下混合存储的方式,哈希值和(或)部分元数据上链,档案内容链下存储;但在国际社会,四种类型均有涉及。

在共识算法方面,常见的有PoW、PoS、DPoS、Paxos、PBFT等。比特币、以太坊等公有链项目大多采用PoW,但该算法的性能效率比较低,在私有链和联盟链项目中的适用性不高。因此,档案界的区块链项目大多将DPoS、PBFT等作为共识机制。中国电建等单位还对共识算法作出优化,将PBFT改造为QBFT,极大地提高了共识效率。

思考与展望

虽然档案界在区块链应用方面已取得一定成效,但仍处于起步阶段,需在以下五个方面展开进一步的理论研究与实践探索。

第一,强化顶层设计,优化制度供给。虽然国家档案局连续多年将区块链列入科技项目选题指南,鼓励各地区、各单位开展实践探索,但各项目的思路和方法存在差异,至今尚未形成普遍性的行业共识,缺乏国家层面的指导意见。而国际标准化组织(ISO)的技术报告《与权威记录、记录系统和记录管理相关的区块链和分布式账本技术》(ISO/WD TR 24332)仍处于起草研究阶段,尚未发布,无法为我国档案区块链项目提供参考。因此,应积极推动国家层面的统筹规划和整体布局,构建区块链与档案管理的政策制度与标准规范体系,加强制度规范供给,将现阶段形成的国内外有益经验以制度规范的形式予以固化。

第二,构建跨行业的档案区块链良性生态。目前,档案区块链项目的节点数量普遍较少。从行业内部来看,需在纵横两个维度扩展,横向需要联结档案主管部门、档案馆、档案室、档案行业学会、档案服务企业、高校、科研院所等相关机构,纵向需要联结不同层级的各类档案机构。从行业外部来看,需要联结法院、公证与取证机关、税务和审计部门等相关机构,或与司法、税务和审计、数据治理等相关领域的区块链进行跨链融合。例如,中石化已经在规划档案联盟链与法律链的跨链管理。此外,档案区块链项目仅靠档案部门是无法实现的,需在项目开展过程中强化与技术公司、高校、科研院所等单位的合作伙伴关系。

第三,明确区块链在档案可信性保障中的定位。目前,我国档案机构普遍将区块链视作一种辅助手段,而国外不少档案机构将区块链作为档案管理系统的底层基础设施。从可信性保障的角度来看,前者基本可满足需求,但如果想基于区块链的可信性保障功能探索更多的应用场景,就需要考虑后者。基于区块链等分布式账本技术搭建档案管理系统,必然要思考区块链系统与档案管理系统的差异、如何基于区块链系统实现档案的长期保存功能、如何将档案管理的理论视角与实践要求融入区块链系统等一系列问题。

第四,针对档案区块链项目面临的管理与技术难题展开重点攻关。一是上链前的档案可信性保障问题。二是区块链透明可信与隐私保护的平衡问题。三是档案区块链的可持续问题,如果供应商放弃或多数节点离开网络,如何对区块链系统中的档案进行迁移,如何继续维护这些档案的可信性。四是区块链特点与档案管理要求之间的冲突。例如,除档案形成阶段的元数据,档案工作者需要在全流程管理活动中持续添加元数据,且档案保管到期需进行彻底的物理销毁,区块链不可删改等特性使其面临法律合规方面的风险;再如,档案机构在长期保存过程中会定期对档案进行格式迁移,将导致哈希值发生变化,无法完成真实性和完整性校验。五是不同区块链系统间的互操作性有待提高。在缺乏顶层设计的情况下,各地区、各单位建立的区块链系统各自为政,不同系统的底层架构、区块结构等都存在差异,容易形成新的区块链孤岛。六是密码学领域的算法存在更新换代的问题,如果算法被破解或失效,以其为基础的信任机制也将面临巨大挑战。可喜的是,国际档案界已开始探索上述问题的解决方案,例如,英国国家档案馆的ARCHANGEL项目正在研发对格式变化不敏感而对内容变化敏感的哈希算法;Hrvoje Stani等学者为解决添加元数据的需要,提出“双存储系统”的解决方案,档案管理系统将由保持数据不变的区块链核心系统和支持部分可变的支持系统组成。

第五,客观公正地看待区块链在档案可信性保障中的作用。区块链不是解决档案可信性问题的“万能灵药”,无法解决所有的信任问题。甚至从现实角度来看,技术叠加的越多,其管理复杂性就越高,区块链可能会使现有的档案可信性保障体系变得更加“臃肿”、复杂。因此,部分档案工作者认为档案信任机制不应依赖“外物”,只需通过管理性手段完成信任构建。但数字时代,管理和技术不是非此即彼的关系,而是相伴相生。对档案机构而言,应沉着冷静地识别档案可信性需求,根据实现信任需满足的条件选择合适的信任构建路径与方法,同时在区块链应用的过程中,要重视和规避区块链可能带来的潜在隐患或次生性问题。

参考文献

Mcleod J, Gormly B. Using the cloud for records storage: issues of trust[J]. Archival Science, 2017(2):1-22.

Information and documentation - Records management - Part 1: Concepts and principles: ISO 15489-1:2016[S/OL].[2022-06-19].https://www.iso.org/standard/62542.html?browse=tc.

InterPARES 2 Project. Ontology C: Trustworthiness of a record[EB/OL].[2022-06-19].http://www.interpares.org/ip2/display_file.cfm?doc=ip2_ontology.pdf.

中国信息通信研究院,可信区块链推进计划.区块链白皮书(2018年)[EB/OL].[2022-06-19].http://www.caict.ac.cn/kxyj/qwfb/bps/201809/P020180905517892312190.pdf.

Information and documentation - Records management processes - Metadata for records - Part 1: Principles: ISO 23081-1:2017[S/OL].[2022-06-19].https://www.iso.org/standard/73172.html?browse=tc.

刘越男,吴云鹏.区块链技术在档案管理中应用路径研究[J].中国档案,2020(9):28-31.

李春艳,乔超.区块链技术在大型企业集团电子文件管理中的应用——以中国石化为例[J].档案学通讯,2020(1):13-20.

Lemieux V L. A typology of blockchain recordkeeping solutions and some reflections on their implications for the future of archival preservation[C/OL].[2022-06-20].https://ieeexplore.ieee.org/document/8258180.

蔡盈芳.电子档案管理应用区块链存储方式探析[J].档案学研究,2020(4):104-109.

王洋.基于优化共识的区块链在电子文件全生命周期真实性保障中的应用——以中国电力建设集团有限公司电子文件单套归档和电子档案单套管理试点为例[J].档案学研究,2022(2):89-96.

贺谭涛.中心动态|电子文件管理研究中心举办“技术变革背景下的电子文件管理实践”学术沙龙[EB/OL].[2022-06-19].https://mp.weixin.qq.com/s/JjYNKp05hj-rjfJo_Do4DQ.

Hrvoje Stani,Vladimir Brali. Digital Archives Relying on Blockchain: Overcoming the Limitations of Data Immutability[J].Computers, 2021, 10(8):1-16.

(作者单位:中国人民大学信息资源管理学院)

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

币赢元宇宙:元宇宙的梦想与现实

人类的感官究竟在多大程度上能够被替代或?全面数字化究竟是不是人类前进的方向?如果生活中的一切皆可以被数字化,那么生活本身的意义又在哪里?「元宇宙」一词最初出现在科幻小说中.

[0:78ms0-3:415ms