区块链:区块链深度学习系列|什么是哈希?

Comunion是一个去中心化的(DAO)组织协作网络,提供面向数字时代的全新商业基础设施和价值转化机制,致力于让劳动价值像资本一样自由流通、交易和积累。

本系列内容包含:基本概念及原理、密码学、共识算法、钱包及节点原理、挖矿原理及实现。

发展史

哈希算法是为了检测数据在传输的过程当中是否被篡改而诞生的。

比如特工A和特工B在进行信息交换,为了防止数据在传输的过程中没有被丢失或者被篡改,这个时候可以使用哈希算法。

特工A将其所发的信息进行哈希,然后将信息和哈希码一起传给特工B,特工B收到之后,也可以对文本进行哈希,然后和这个哈希码进行匹配,如果匹配上的话,说明信息在传播的过程当中没有丢失或者被篡改。

我国首个超大城市区块链基础设施支持数百亿条数据共享:金色财经报道,北京市目录链2.0于1月1日0时上线,目前北京市80余个部门的市级数据目录、16个区与经济技术开发区的区级数据目录,以及民生、金融等领域10余家社会机构的数据目录全部上“链”。这是我国首个超大城市区块链基础设施。(新华社)[2023/1/12 11:08:25]

最开始诞生的是MD4和MD5。1990年,工作于麻省理工学院的教授RonaldRivest设计了一种信息摘要算法,这就是MD4,次年MD5诞生。

说到MD4,大家可能听说过,我们国家的王小云院士曾经将其攻破过,这是一个很重要的研究成果。普通破解MD4法,需要计算2的55次方,而王院士把时间复杂度给降低了,他只需要2的10次方~20方,就把MD4破解了,这就把破解所需的量级降低了很多。

声音 | 经济学家乔治·吉尔德:全球区块链将迎来爆发式发展:据深圳商报消息,近日世界经济学家乔治·吉尔德详细解读了“谷歌十大定律”,并逐条与他所推出的“后谷歌时代密算体系十大定律”进行对比分析,讲解了区块链“安全、细致”的特征及发展趋势。 他还预测,以谷歌为代表的大数据时代互联网体系将终结,基于区块链技术的加密算法体系将创建全新的技术构架取而代之。全球区块链将迎来爆发式发展,必将改变整个经济和互联网面貌。[2018/11/14]

沿着时间顺序后面诞生了SHA-0、SHA-1、SHA-2、SHA-3。

目前来说SHA是一个安全的哈希算法,按版本来说才到了SHA-3,其中每个版本相当于一个家族,里面会包含很多不同的哈希算法。

声音 | 币威刘志华:区块链应用应兼顾用户安全与体验:据凤凰网9月3日消息,币威技术合伙人刘志华认为:大多数交易平台运营方的安全素养和平台自身的安全性都存在不同程度的漏洞。安全问题主要集中在以下两个方面:一是从用户角度来讲,用户账号和钱包被盗与遭遇欺诈、私钥保管不当等原因有关。二是从区块链行业自身的发展阶段来讲,区块链行业还处于早期发展阶段,各方面都在逐步完善中。针对区块链领域日益凸显的安全问题,刘志华认为,区块链领域的创业公司,从用户体验的角度出发,不应当让用户去承担私钥丢失带来的风险。[2018/9/3]

MD4出现之后,美国国家标准技术研究院,开始进行一个公开的算法募集。

1997年左右,SHA-0家族开始全球性征集算法,任何人有好的算法都可以提交。这其实是一个全球的算法竞争,其目的是收录全球公认能最好的算法,以此扩充家族。

声音 | 美国银行前高级副总裁:美国银行区块链专利“毫无意义”:据ccn报道,名字被列入美国银行八项区块链专利作为发明人的前高级副总裁Michael Wuehler表示,美国银行申请的区块链专利从根本上讲“毫无意义”,除了作为新闻报道并使这家有113年悠久历史的银行被人们认为是金融科技领域的创新者。[2018/8/28]

随着时间的推移,产生了SHA-2,我们之前所说比特币里面使用的算法SHA-256,就是隶属于SHA-2家族里面的算法。SHA-2家族里面包含众多算法,比如:SHA-168、SHA-512等,都有不同的尾缀。拿SHA-256来说,256是指算法输出的字符长度。

提到SHA-256,大家可能会想一下我们前文提到的问题:中本聪为什么选择用SHA-266,而不是其他的哈希算法呢?

SEC 沃斯堡办公室发推:正在考虑在名字中添加“区块链”:美国证券交易委员会沃斯堡办公室发推称,正在考虑在名字中添加“区块链”,这样我们追随者就会增加700倍。美国证券交易委员会沃斯堡办公室覆盖德克萨斯州,俄克拉荷马州,阿肯色州,堪萨斯州的业务。[2018/1/9]

刚才我们也说过SHA家族的成长是按照时间顺序来的,当中本聪使用这个算法是在2008年,那个时候SHA-2家族里面的算法在当时是比较盛行的,虽然当时SHA-3也出来了,但是还不太成熟。

所以中本聪采用了SHA-2里面的SHA-256算法,应用到比特币系统里面去。

沿着时间顺序往下走,我们会看到以太坊里面使用的哈希算法,就不是SHA-2家族里面的了,而是SHA-3家族里面的。这是因为到2014年的时候,SHA-3里的算法已经稳定下来了,并且其性能远优于SHA-2里的算法。

开发者采用的算法也是根据哈希算法的成熟度,来不断的去采用更成熟、更好的算法。

所以如果读者想设计一个区块链系统,如果里面涉及到使用哈希算法的话,那么一定要选择更好哈希算法,而不是一味模仿之前的系统,这些SHA算法仅仅是一个加密算法而已,没有我们想的那么神秘。

哈希函数

哈希函数最开始被称之为摘要函数,意思是消息摘要,下图是对它的定义:哈希函数是为了对于任意长的字符串产生一个消息摘要。

这段话其实有一些含义没有表达出来,对任意长的一个字符串进行哈希,可以产生一个哈希摘要,也就是产生一个由0和1组成的字符串。这个字符串如果给到SHA-256的话,那其产生的消息摘要会是一个256比特由0和1组成的数据串。

摘要函数是由一对ppt算法组成的,这两个算法需要满足两个性质。

ppt算法的意思是概率多项式时间算法,那么什么是概率多项式时间算法呢?

什么叫概率算法?

概率算法也叫随机算法,也就是算法在执行过程中随机地选择下一个计算步骤。其意义是,很大程度上降低算法的复杂度。

比如抛硬币,需要猜硬币是正面还是反面,那么解决这个问题的成功概率是50%,算法只需要重复正或者反就可以了。

什么是多项式?

假设我有一个问题,这个问题是有规模的,规模用参数λ来表示,再引入常数a和c,将其做成一个多项式:a乘以λ的C次方。其中λ是一个安全参数,如问题的规模,密码系统的安全级别,私钥长度等。

概率多项式时间算法组合起来通俗地说就是:当这个算法应用于某一项方案或者攻击一个密码系统,算法最多能运行a乘以λ的C次方的时间,在这个时间内能以多大的概率去解决这个问题或者攻破这个密码系统。

这样的设计使哈希算法非常高效。

需要满足的两个条件

上图第一句话,1λ是一个安全参数,即将安全参数输入到Gen算法中产生一个s。

我们上文讲了有很多哈希家族,每个哈希家族中又包含很多哈希算法,那么到底用哪个算法呢?这里的s就是表示选择的算法,比如选用了SHA-256,那么s就可以确定。

第二句话,最前面是一个自然数,后面的??x中x,指任意的字符串,这句话的意思是任意字符串可以任意长,并且用0和1来表示。

继续往下看,H上标s和x,由于第一句话的时候s确定了,那么此时H也就可以确定。

再往下走,对于任意两个消息m1和m2,如果这两个消息经过哈希函数产生的结果是一样的,那么此时就产生了一个碰撞。

我们通过简单分析哈希的定义,其实能发现一个特点:哈希算法能将任意长的输入数据压缩成固定长且短的数据。

例如SHA-256算法能够将任意长的一个字符串,哈希成一个256比特长的由0和1组成的数据串。

利用这个特点我们也就能返回去解释为什么在区块链当中会使用哈希算法。

下期预告:哈希碰撞原理

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

[0:0ms0-3:745ms