本文来自:区块链大本营,星球日报经授权转发。
提起“默克尔树作为底层数据结构的分布式系统”你会想起谁?除了区块链,其实还有你最熟悉的陌生人——Git。“简化版”的区块链
从许多角度看,Git都像简化版的区块链。Git的开发始于2005年。彼时,Linux内核开发团队正被之前使用的专有代码管理系统BitKeeper所困扰,LinusTorvalds希望获得一种体验近似BitKeeper的分布式系统,遍寻不得,便选择了自行开发。
Git项目开发效率惊人——Linus4月3日开工,6日向社区宣布,7日实现self-hosting,18日第一批分枝合并,29日就能以每秒6.7次的速度向Linux内核代码树打补丁。6月,在Git的控制下,便发布了2.6.12版内核。如果用三句话阐述Git的运行原理,那就是:生成修改过的文件生成当前目录tree文件,关联当前状态文件生成commit文件,关联到当前目录tree文件,并记下父commit
其使用方式可简单描述为:本地提交,累积几次后push到remote。本次提交会关联上一次提交,跟区块链是不是类似?版本控制最重要的是可追溯,如果某次错误提交,还可以回退到历史版本——可追溯也是区块链的重要特性。区块链是分布式的,Git天然就是分布式,不过Git依赖文件系统。以GitHub上的操作为例,代码或者文档一旦提交,操作将无法撤销。如果程序员clonerepo,只要不删除,将永久存储在自身电脑,除非文件系统崩溃;如果某程序员fork该repo,只要账户不被删除,这个repo将永久保留在账户之下。另外,某个repofork、clone次数越多,被摧毁的概率也就越低;再者,某个repo即使最近一次操作清空了所有代码,还可以通过gitlog恢复。区块链的另一个特性是不可篡改,也就是只能Insert。Git呢?GitHub托管的repo里的内容本身是可以修改的,然而这个commit历史却是无法修改的。每一次commit都有唯一标志,本次commit会有parentcommit的信息。Git产生的log也可以通区块链数据库类比。而且,谁能说“不可修改”或者具备共识算法就是可称为区块链的充分条件呢?
抹链科技正式加入中国食药区块链专委会,出任副会长单位:4月24日消息,抹链科技正式加入中国食品药品企业质量安全促进会区块链专业专委会(简称:中国食药区块链专委会),出任副会长单位。中国食药区块链专委会于1月19日,由中国食品药品企业质量安全促进会批复同意,此后将陆续出版《中国食药区块链内参》、《中国食品药品区块链应用蓝皮书》,开展中国食品药品区块链创新应用试点、中国食品药品区块链相关标准制定、中国区块链基础普及和技术应用培训等系列工作。(人民政协网)[2020/4/24]
如果将视角转向底层,我们能发现两者更多相似。共同的底层数据结构——默克尔树
区块链与Git内部数据结构都以树形数据对象表示——即以默克尔树作为底层数据结构。默克尔树这种现代数据结构是由计算机科学家RalphMerkle在1979年提出,并以他的名字命名。
声音 | 招行行长助理:招银理财已开始探索将区块链等技术应用到利率预测等业务场景中:据21世纪经济报道,4月22日,在获批筹建理财子公司3天后,招商银行行长助理兼资产管理部总经理刘辉接受21世纪经济报道等媒体访问,刘辉表示,金融科技将是招银理财构建核心竞争力的抓手,目前招银理财已经开始探索将机器学习、自然语言处理、区块链、RPA等技术应用到利率预测、舆情监测、ABS和运营等业务场景中。[2019/4/24]
这种数据结构的特点是:大多数为二叉树,也可以多叉树,无论是几叉树,它都具有树结构的所有特点叶子节点value是数据集合的单元数据或者单元数据Hash非叶子节点的value是根据它下面所有的叶子节点值,然后按照Hash算法计算而得出
近年来,除了Bitcoin、Ethereum、IPFS,一大批计算机工程突破,都得益于这种数据结构进行完整性校验,例如文件系统ZFS、Btrfs,另一种分布式版本控制系统Mercurial,NoSQL数据库ApacheCassandra、Riak、Dynamo等。BT下载,也是通过默克尔树进行完整性校验。要实现完整性校验,最简单的方法是对整个数据文件做Hash运算,把得到的Hash值公布在网上,下载数据后,再次运算Hash值,如果运算结果相等,就表示没有任何的损坏。假如从稳定的服务器上下载,那么采用单个Hash来进行校验的形式是可以接受的。但在点对点网络中作数据传输时,会从同时从多个机器上下载,且线路充斥着不稳定,这时需要有更加巧妙的做法。实际中,都是把比较大的一个文件,切成小块。如果有一个小块数据在传输过程中损坏,只要重新下载这一个数据块就行。当然这就要求每个数据块都拥有自己的Hash值。以我们熟悉的BT下载为例,下载真正的数据之前,会先下载一个Hash列表的。这时有一个问题出现——那么多的Hash,怎么保证它们本身都是正确地呢?答案是需要一个“根Hash”。把每个小块的Hash值拼到一起,然后对整个这个长长的字符串再做一次Hash运算,最终的结果就是Hash列表的根Hash。于是,如果我们能够保证从一个绝对可信的网站,或者从我们的朋友手里拿到一个正确的根Hash,就可以用它来校验Hash列表中的每一个Hash都是正确的,进而可以保证下载的每一个数据块的正确性了。这种设想挺好,但实际应用中,还有不足,这就是为什么要发默克尔树。在最底层,与Hash列表一样,数据被分成小块,有相应的Hash和其对应。但是往上走,并不是直接去运算根Hash,而是把相邻的两个Hash合并成一个字符串,然后运算这个字符串的Hash,这样每两个Hash就结婚生子,得到了一个“子Hash”。如果最底层的Hash总数是单数,那到最后必然出现一个单身Hash,这种情况就直接对它进行Hash运算,所以也能得到它的子Hash。于是往上推,依然是一样的方式,可以得到数目更少的新一级Hash,最终必然形成一棵倒挂的树,到了树根的这个位置,这一代就剩下一个根Hash了,称为默克尔根。相对于HashList,MerkleTree的明显的一个好处是可以单独拿出一个分支来对部分数据进行校验,这个很多使用场合就带来了Hash列表所不能比拟的方便和高效。参考文章:https://www.jianshu.com/p/458e5890662fhttps://dbarobin.com/2018/02/06/blockchain-vs-git/
行情 | 区块链百度搜索热度同比上涨284%:百度搜索热度中,“区块链”的搜索热度近7日整体日均值为11,979,整体同比上涨284%,但整体环比下降了1%。[2018/7/9]
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。