BLO:王嘉平:源码解析区块链的工作原理

从零开始搭建一个类似以太坊数字货币的最小化区块链系统。

原文标题:《源代码:一个最小化的区块链系统》撰文:王嘉平,中科院计算所博士,曾带领团队在NSDI2019发表高性能并行分片区块链系统的论文

近期有个国内著名技术协会的约稿,正好向技术圈分享一下我对区块链系统的拙见。我发现一件有趣的事情,即使是有计算机背景,懂编程的同学,都也不怎么清楚区块链到底是怎么回事。今天这里,我打算用计算机语言和大家沟通,争取可以至少让计算机背景的同学,彻底弄明白区块链是咋回事,是怎么工作的。

不过在开始之前,需要明确的一件事情是,同之前的计算机技术不同,区块链技术核心关乎的是一个计算系统的自动化监管和治理,而不是为了让计算更高效或更大规模地发生。需要明确这个期望,才方便我们去理解,为什么区块链是这样设计的,这样工作的。

我们将以最简化的加密数字货币为例介绍区块链的精确工作原理,为了便于理解将省略手续费,大部分优化,互操作性等层面的东西。这里会用到强类型的伪代码,来精确定义其数据结构和执行逻辑。这里我们将从零开始实现一个类似以太坊数字货币那样的区块链系统,为了便于理解,我们将采用以太坊所采用的账户-状态模型来表示账簿,而不是比特币的那种UTXO。

我们先从一系列基础实体和原语的定义开始:

基础数据类型

classString;//基础字符串数据结构classBlob;//基础二进制数据,用来表示对象序列化之后的线性二进制数据classCriticalSection;//临界区,多线程互斥对象classBigInt;//区块链中很多地方的数值采用大整数来表示,例如余额,挖矿难度等。//例如用一个32字节的无符号大整数,表示0到2^256-1的整数。

数字签名原语

标准的非对称加密系统里面的函数,公私钥对可以在不联网的情况下,任意生成,并且全球唯一。通常为32到64字节的无结构二进制数据。其中公钥会公开,在区块链系统中用来表明特定身份,供他人验证其对特定账户的控制权。而私钥则用来通过数字签名来证明其对账户的控制。

币安将上线DODO 1-20倍 U本位永续合约:金色财经报道,币安发布公告表示,将于2023年08月08日20:00(东八区时间)上线DODO 1-20倍 U本位永续合约。[2023/8/7 21:30:04]

VerifySignature原语,用来对于给定数据和签名,验证是不是对应的签名者签署的。

typedefBYTEPublicKey;//公钥数据typedefBYTEPrivateKey;//私钥数据typedefBYTESignature;//数字签名数据voidSign(Blobdata,PrivateKeysk,Signaturesigdata);//数字签名boolVerifySignature(Blobdata,PublicKeypk,Signaturesigdata);//检查数字签名是否正确

账户地址

在我们这里的例子中,所有哈希函数都采用SHA256,其将产生一个32字节的哈希值。地址是账户的标识符,是一个32字节的无结构二进制数据,由公钥的哈希值SHA256(PublicKey)得到。那么也就是说每个公钥,对应一个唯一的地址,对应一个唯一的账户。

typedefBYTEHashValue;//SHA256的哈希值typedefHashValueAddress;//账户地址HashValueSHA256(Blobdata);//SHA256哈希函数

智能合约(SmartContract)

这个有点像一个C的类,定义了一些状态,以及修改这些状态的函数。一个区块链系统中,可以有多个智能合约同时存在,但是每个仅会有一个实例。这里我们就数字货币给出一个极度简化的智能合约的例子:

classMyCoin{//internalstatehash_map<Address,BigInt>_Ledger;//internalfunctionBigInt_GetBalance(Addressaddr){if(_Ledger

法国正试图吸引美国加密货币公司:金色财经报道,法国将欢迎美国所有致力于区块链和加密货币的公司和企业,因为它旨在建立其数字基础设施和产品。监管机构目前正在努力建立一个新的框架,以使美国能够从其不断增长的加密货币环境中受益。其目的也是为了吸引美国更多的加密货币公司,并显得更有吸引力,有可能激励其中一些公司跨越大西洋迁往4000英里,在美国境内设立站点。(livebitcoinnews)[2023/6/30 22:09:10]

//转账函数voidTransfer(Addresssigner,Addressfrom,Addressto,BigIntamount){if(signer!=from)return;if(amount>0&&_GetBalance(from)>=amount){_Ledger-=amount;amount=_GetBalance(to);_Ledger=amount;}}//挖矿奖励函数voidCoinBase(intheight,Addressminer){BigIntreward=5000000000;//这里简化为,每次奖励50个币if(reward>0){reward=_GetBalance(miner);_Ledger=reward;}}};

交易(Transaction)

一个交易表示对特定相关账户一次状态修改请求。交易中不携带任何逻辑代码,仅仅是指定这个交易将调用智能合约里面的哪个公开函数及其调用参数。当然在我们这个极度简化的系统中,只有一种交易,即前面的转账(Transfer)。交易的发起方必须为扣款方(from),并且整个交易携带对交易内容的数字签名,以确信该交易由扣款方发起。基于我们这里的例子,一个交易至少含有以下结构:

structTransaction{StringInvokeFunctionName;//在我们这里始终为「Transfer」BlobInvokeArguments;//序列化之后的调用参数PublicKeySigner;//发起者的公钥,注意这里不是地址SignatureSignData;//由发起者的私钥对交易的签名};

比特币全网未确认交易数量为1753笔:金色财经报道,BTC.com数据显示,目前比特币全网未确认交易数量为1753笔,全网算力为263.31 EH/s,24小时交易速率为3.80交易/s,目前全网难度为34.09 T,预测下次难度上调8.99%至37.16 T,距离调整还剩1天7小时。[2023/1/15 11:12:25]

区块(Block)

一个区块表示区块链接力执行中的一步,里面主要包含这一步中确认的一批交易,以及共识机制验证数据和块头元数据。一个最简化的定义可以是这样:

structBlock{intTimestamp;//出块时间HashValuePrevBlock;//上一个块的哈希值AddressMiner;//矿工地址intTxnCount;//这个块中包含的交易个数TransactionTxns;//完整的交易列表BigIntPowTarget;//工作量证明的目标(共识验证数据)intPowNonce;//工作量证明的Nonce值(共识验证数据。;

这里我们给出了最简化的工作量证明(Proof-of-Work)的验证数据结构,如果采用其他共识算法,这个部分会有变化。从这个结构可以看出,区块链之所以称为链,就是因为区块结构中包含一个指向上一个区块的「指针」,PrevBlock。任何一个被确认的区块,同时也意味着承认其全部的前驱区块,以及这些区块所携带的全部交易。一个区块被确认有三个条件:

这个区块的共识验证要满足其特定共识算法的要求。在工作量证明算法中,PowTarget必须小于当前挖矿难度的要求,同时((BigInt&)SHA256(Block))<Block::PowTarget。这个块所包含的交易必须没有被之前的区块包含过,并且每个交易必须能够保证其数字签名能够被其Signer的公钥正确验证。至于交易所执行的逻辑是否正确,是否出错则无关紧要。在所有分叉块中,即具有相同PrevBlock的块,只有优先的块会被确认。这一点不同的共识算法有不同的情况。P2P通讯原语

数据:亚太地区约21%的人正在使用DeFi:金色财经报道,Visa亚太地区区域加密主管Nischint Sanghavi在接受彭博社采访时表示,亚太地区21%的人表示他们目前正在使用DeFi,他们对DeFi感兴趣的人数可能是这个数字的两倍。[2022/9/13 13:25:40]

区块链的网络层仅用到了P2P网络技术中简单的部分,用基于TCP长连接的Gossip协议实现一个数据块的全网广播(Flooding)。我们这里将其抽象下面的通讯原语:

interfaceBroadcastNetwork{template<typenameT>voidBroadcast(constT&object);//将对象序列化并广播出去functionOnRecvBlock;//接收到一个区块的回调函数functionOnRecvTransaction;//接收到一个交易的回调函数};

内存池(Mempool)原语

内存池在区块链系统中用来记录尚未被确认的交易,很容易用比如哈希表来实现。

interfaceMempool{boolHas(Transactiontxn);voidInsert(Transactionnew_txn);voidRemove(Transactiontxns);intCollect(Transactiontxns);};

其中Collect原语用于挖矿时合成新的区块,从mempool中挑出一系列交易来填充Txns数组,最多挑TxnMaxCount个,并返回实际填充的个数。

区块归档数据库原语

区块链系统中的区块以及交易,在被确认之后,将从内存中移除,并写入归档数据库中。这个部分很容易用一个Key-valuestorage系统来实现,当然用SQL数据可也是可以的,就是效率低一些。

interfaceArchiveDatabase{voidArchive(Transactiontxns);voidArchive(Blockblk);voidHas(Transactiontxn);voidHas(Blockblk);}

Web3社交协议Light推出v1.0版本,并将于三季度推出社交钱包:6月27日消息,基于CyberConnect搭建的Web3社交协议Light宣布推出v1.0版本,并将于今年三季度推出社交钱包。社交钱包将内嵌Web3原生组件,帮助用户简化Web3流程。[2022/6/27 1:33:37]

有了这些定义之后,我们可以给出一个不考虑分叉情况下最简单的基于工作量证明的区块链系统的伪代码:

staticconstintTARGET_ADJUST_INTERVAL=256;//每隔256个块调整一次算力难度staticconstintBLOCK_CREATION_INTERVAL=600*1000;//每十分钟出一个块staticconstintTRANSCATION_PERBLOCK_MAX=1024;//每块最多包含1024个交易BroadcastNetwork*g_pNet=BroadcastNetwork::Create(...);Mempool*g_pMempool=Mempool::Create(...);ArchiveDatabase*g_pArchiDB=ArchiveDatabase::Create(...);MyCoing_MyLedger;//账簿//当前区块链的头Blockg_BlockHead=Block::GenesisBlock(6);//初始化为创始区块HashValueg_BlockHeadHash=SHA256(g_BlockHead);intg_BlockNextHeight=1;CriticalSectiong_BlockHeadCS;//下一个块的共识相关信息(工作量证明)PowTargetg_NextPowTarget=Block::InitialPowTarget();//初始挖矿难度intg_LastTargetAdjustedTime;//收到来自网络广播的交易g_pNet->OnRecvTransaction=(Transactiontxn){if(g_pMempool->Has(txn)||g_pArchiDB->Has(txn))return;//忽略已经存在的交易if(!VerifySignature(txn

;//收到来自网络广播的区块g_pNet->OnRecvBlock=(Blockblk){if(blk

//至此这个区块被确认g_pNet->Broadcast(txn);//确认之后,尽快接力这个区块的广播g_MyLedger

g_LastTargetAdjustedTime=blk

//更新区块链头在最新的这个块g_BlockHeadHash=h;g_BlockHead=blk;g_BlockNextHeight;}g_BlockHeadCS

;

这里涉及到一个上面没有定义的算法,PowTargetAdjustment是用来根据近期出块速度来调整出块算力难度要求,从而使得出块的平均间隔的期望可以大体稳定在一个预先设定的值(BLOCK_CREATION_INTERVAL)。这是一个和工作量证明共识算法有关的算法,并不是所有区块链系统都有。这个算法的一个最简化定义如下:

算力难度调整

BigIntPowTargetAdjustment(BigIntcur_target,intnth_block_interval){returncur_target*nth_block_interval/(BLOCK_CREATION_INTERVAL*TARGET_ADJUST_INTERVAL);}

到这里一个不出块的区块链节点,即全节点就可以工作了。全节点是区块链网络中的大多数节点,是区块链底层P2P网络得以稳定鲁棒运行的保障,同时也实现了区块数据和交易数据的高度冗余的全网存储。虽然不出块,全节点不同于互联网架构的客户端。一个全节点不需要信赖其他节点,更不存在一个服务器。全节点能够独立自主地验证区块链完整的历史演进过程,进而重构其上的状态(例如一个账户的余额),而不是去向一个需要信赖的服务器查询。

当然,区块链网络计算接力过程是由出块节点完成了,也就是所谓的矿工节点。这些少数节点,和大量的全节点混在一起,大部分节点收到最新的区块是来自于其他全节点的接力广播,而不是直接来自于一个出块节点。当然,作为接受方,也无从判断发送方是中继的全节点,还是刚刚出块的矿工节点。这也有效地保护了真正出块节点的安全性,避免暴露矿工节点的物理IP地址。

一个出块节点,首先是一个全节点,除了上面定义的这些行为之外,还需要一个额外的过程,运行在一个或者多个线程上。我们定义最简化的出块过程如下:

voidMining(){while(g_KeepMining){//构造新的块,这个部分需要和区块链头更新代码互斥g_BlockHeadCS.Lock();{intnext_height=g_BlockNextHeight;Blocknew_block;new_block.Timestamp=os::GetCurrentTime();new_block.PrevBlock=g_BlockHeadHash;//指向最新的块new_block.Miner=g_MyAddress;new_block.TxnCount=g_pMempool->Collect(new_block.Txns);new_block.PowTarget=g_NextPowTarget;new_block.PowNonce=os::Random<Int64>();//随机初始值}g_BlockHeadCS.Unlock();//开始挖矿while(next_height==g_BlockNextHeight){if(((BigInt64&)SHA256(new_block))<new_block.PowTarget){//挖矿成功g_pNet->Broadcast(new_block);//立即广播出去g_pNet->OnRecvBlock(new_block);//更新本节点的区块链头break;//开始去挖下一个块}new_block.PowNonce;//尝试下一个Nonce}//大多数情况下,其他节点出了新的块,并更新了区块高度//则挖矿被打断,去挖更新之后的下一个块}}

来源链接:zhuanlan.zhihu.com

免责声明:作为区块链信息平台,本站所发布文章仅代表作者个人观点,与链闻ChainNews立场无关。文章内的信息、意见等均仅供参考,并非作为或被视为实际投资建议。

以太坊

以太坊

开放的分布式区块链应用平台,通过其专属加密货币Ether以太币提供去中心化的虚拟机,处理点对点合约。允许任何人建立和使用通过区块链技术运行的去中心化应用,没有任何欺诈、审查、第三方监管。以太坊的概念首次在2013至2014年由维塔利克·布特林VitalikButerin受比特币启发后提出,旨在共同构建一个更全球化、更自由、更可靠的互联网。以太坊EthereumETH以太坊区块链以太坊发展企业以太坊联盟以太坊入门新手ERC20ERC-20ERC20ERC721ERC-721以太坊2.0以太坊2.0以太坊社区基金查看更多

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

[0:15ms0-4:640ms