多读书多实践,勤思考善领悟

区块链科普文

本文于1554天之前发表,文中内容可能已经过时。

这篇文章是给非计算机专业的朋友的科普文,尽量避开了比较专业的细节。如果你是计算机相关专业,或者具备一定数据结构、算法、密码学的知识,建议直接看文末参考资料中的三篇博文,或者更专业的资料。

一. 区块链通俗易懂的解释

解释例子1:

区块链可以视作一个账本,每个区块可以视作一页账,其通过记录时间的先后顺序链接起来就形成了“账本”。

在商业领域,假账错账是十分头疼的事情。而通过区块链技术,则每一笔交易通过分布式留存,任何节点想要篡改几乎没有可能。即使单一区块数据损坏,链上其他区块也有完整且真实的数据留存。区块链在构筑现代商业社会的交易、安全、信用等体系上意义重大。

解释例子2:

假如你是一位女性,在某年某月某日的晚上,你男票给你说了一句“我爱你一生一世”。然后你把这句话发给了你的闺蜜,爸妈,朋友圈,公众号,微信群等,你男票再也无法抵赖,你打赏点小费感谢他们帮你记住并作证,我们说这个小费呢,就是token。 你,你男朋友、“我爱你一生一世”这句话、说这句话的时间地点等信息,打包起来形成一个结构化的信息包,这个信息包就叫“区块”。 而你的闺蜜、爸妈、朋友圈、公众号和微信群等节点就是“链”。 然后你男票不承认说过这句话,当了负心汉,你翻出这个账本对质,把他丫的臭骂一顿,这就是区块链应用。还有啊,男朋友这个节点会永远被踢出网络。当然网络更大的情况下,这个男的可能永远找不到女朋友。

二. 区块链关键词

1. 区块链:去中心化的分布式数据库

大家都知道,“比特币”是一种数字货币。而“区块链”就是比特币的记账系统。可以把区块链想象成一个账本,上面记录了全球所有的比特币交易信息。那么,区块链跟传统的银行记账有什么区别呢?

  • 数据库:

所谓“数据库”,就是计算机上的一组表格,它可以存放大量的有结构的信息(可以类比Excel,但远比Excel复杂)。比如我们去银行存款、取款、汇款,这些交易信息都是要上传到银行的数据库的。

  • 分布式:

这个数据库可以存放在银行的一台超级电脑上,也可以放在多台电脑上。比如工行可能在华北、华中、华东、华南等地区各有一台服务器,每个地区的交易信息发送到本地区的服务器上,各个服务器之间通过银行的内部网络连接。这就叫“分布式数据库”。

  • 去中心化:

传统的服务器,不管是不是分布式的,都是有“管理员”的。也就是说,有一个银行内部的“超级用户”可以查看所有的交易信息,并且可以随意添加、修改这些信息。这就叫“中心化”。

而区块链则是“去中心化”的。也就是说,区块链这个数据库中不存在管理员,所有人都是平等的,都有权查看、添加信息。去中心化是区块链的本质特征。

既然所有人都有权往区块链上添加信息,那么这个“账本”难道不会乱七八糟吗?要搞清楚这点,我们需要了解什么是“区块”,什么是“链”。

何为“区块”何为“链”?“区块”是区块链的基本组成。区块就是一个数据块。类比账本的话,区块就相当于账本上的一页,这一页上记录了多条交易信息。而把这些分散在整个互联网上的“页”串成一条链,就可以形成一个完整的“账本”。那么,“区块”是怎么串成“区块链”的呢?

2. 区块链账本的记账原理

  • 哈希值与防篡改:

除了比特币交易信息之外,区块上还包含了这个区块本身的一些特征信息。可以类比一页上的“页码”,只不过这个“页码”比较复杂。“页码”中最重要的,就是“哈希值”,它是理解区块链可靠性的关键。

所谓“哈希值”,可以理解为数据的一个“指纹”。我们签合同有时会摁手印,以后只要把自己的指纹和合同上的指纹对比一下,就可以证明合同是自己签的。类似地,我们在网上下载一个软件,有些网站会给出安装包的哈希值(可能称为CRC或SHA)。我们下载完安装包后,只需用专门的工具计算一下这个SHA值,再跟官网上给的SHA值对比一下,就可以知道自己下载的和网站提供的是否100%一致,下载过程有没有被人做了手脚。

不同的数据,算出来的哈希值一般来说是不同的。如果已知数据A的哈希值是H,想伪造另一个数据B,使它的哈希值也是H,这是极其困难的。也就是说,哈希值具有不可伪造性,起到了“指纹”的作用。

一个区块中,包含了两种哈希值:“上一个区块的哈希值”和“本区块的哈希值”。因为每个区块都包含了上一个区块的哈希值,所有的区块就依次连成一条(逻辑上的)链。“上一个区块的哈希值”就起到了“页码”的作用——给页排序。

img
▲区块所包含的内容
img
▲区块连接成区块链

如果一个区块上的交易信息被人恶意篡改的话,“本区块的哈希值”就会改变。由于区块链中下一个区块包含了“上一个区块的哈希值”,为了让下一个区块依然能连到本区块,需要修改下一个区块。而这又导致下下个、下下下个……区块也必须修改。

img
▲篡改了一个区块,就要修改后面所有区块

由于区块链本身的一些机制(这个机制比较细节,我们这里不讨论),计算一个区块的哈希值是极其困难的,修改多个区块的哈希值则是难上加难。这样,篡改区块链中的交易信息就成为几乎不可能的事情。这就保证了区块链的可靠性。

  • 采矿:向区块链写入信息的方式

采矿:向区块链写入信息的方式“采矿”,就是计算出一个潜在区块的哈希值,使这个区块正式加入整个区块链的过程。一个区块加入区块链后,其中包含的交易信息才能成为事实。由于比特币设计者的一些考虑,采矿的过程需要消耗大量时间和资源。前面已经提到,计算区块的哈希值是极其困难的。具体有多困难呢?如果比特币网络中的计算机都参与哈希值的计算,平均每十分钟才能算出一个哈希值。

从事采矿活动的人,称为“矿工”。互联网上的任何人都可以加入比特币网络,成为矿工。既然采矿需要消耗大量时间和资源,为什么矿工会自愿加入呢?这是因为比特币协议规定,挖到新区块的矿工会得到比特币奖励。这是矿工采矿的动力;也因为矿工持续得挖矿,比特币交易信息才能被确认,比特币交易才能正常进行。同时,这也是比特币总量唯一的增加方式。比特币不像传统货币,它的总量不能通过国家或机构人为印发的方式增加,只能通过挖矿奖励的方式“自然地”增加。

  • 如何避免主链分叉?

既然挖矿会有比特币奖励,比特币的交易方也会给矿工一些手续费作为报酬,矿工之间难免会产生大量竞争。如果两个矿工同时挖到了某个区块的下一个区块,那么谁挖到的那个区块有资格加入区块链呢?如果都可以加入区块链,区块链产生了分叉,这样如何保证区块链的“唯一性”呢?

区块链协议规定,如果一个分叉上的新增区块达到了六个,那么它就成为区块链的“正统”;而同一时刻其他没有达到六个区块的分叉,就会被不幸淘汰,这些区块上的交易信息也不会被认可。这就避免了区块链的分叉。由于一个区块在被挖出来后,后面必须跟上六个新区块,而平均每十分钟才能挖到一个新区块,这样,一笔交易至少需要一个小时才能被确认(被写进区块链)。

img
▲矿工B:我有一句喵喵喵不知当不当讲

3. 综合上文,那么比特币交易的过程是怎样的呢?

交易无非就是一条信息:“买方-1$,卖方+1$。”(这里涉及到一些非对称密码的知识,由于不是比特币所独有,不作讨论。)当你发起一笔比特币交易后,这个交易信息就会从你的设备上,逐渐发送到整个比特币网络。

为了挖矿奖励,许多矿工都会收集你的交易信息,并拼命挖新的区块。如果一个矿工挖出了一个新的区块,他就会把你的交易信息写入区块。在这之后,他还需要再挖出六个新的区块,以保证整个区块链采用了这个区块。这时你的交易信息才能正式写入区块链,得到确认。而那些没有挖到六个区块的矿工的成果则会被淘汰。

这样,虽然是多个矿工在竞争着写入你的交易信息,最后只能有一个矿工成功地写入。这就保证了同一次交易中,你的钱不会被扣掉两次。

一旦一个新的区块正式加入了区块链,这个区块就会被同步到所有矿工的机器上,新的区块只能跟在这个区块后面。而挖到这个区块的矿工会获得一些比特币作为奖励,这也是新比特币发行的过程。

4. 小结一下以上的要点:

  • 区块链是比特币交易的可靠的、唯一的账本。区块链是一个无中心的分布式数据库。

  • 它没有管理员,网络中的所有用户都可以平等地向区块链中写入新的区块。

  • 区块根据“上个区块的哈希值”而连接成一条链。
  • 计算哈希值的困难性,使得区块和区块链无法被篡改,保证了区块和区块链的可靠性。
  • 一个区块后面新增六个区块才能使它正式加入区块链,这使得区块链不会产生分叉,保证了区块链的唯一性。但同时,这也导致比特币交易至少需要一个小时来确认,不具有即时性。
  • 挖矿奖励是比特币唯一的发行机制,也是矿工挖矿的动力。

三. 区块链工作原理

先举个例子,我和你打赌50元明天的天气。我赌它会是晴天,你赌它会是雨天。我们会有三种方式来完成交易:

①我们信任彼此。不论结果是晴天,还是雨天,输家要给赢家50元。如果我们是朋友,这会是一个好的交易方式。然而,即便是朋友,也有可能会赖皮不认输而不愿付钱,更何况是陌生人。

②我们可以订定合约,如果有任何一方不愿付钱,赢家可以告输家。但要花钱花时间打官司,只为了讨回50元,实在是得不偿失。

③我们找一个中立的第三者,每人分别先给她50元,结果揭晓后,她再把所有的钱100元给赢家。无奈的是,这个第三者有可能卷款潜逃。

我们无法信任陌生人,也觉得打官司劳神伤财。

区块链技术很有趣,因为它帮我们实现第③种交易方式,而且安全、快速和便宜。

我们只需写几行程序代码,让它执行在区块链网络(Blockchain Network)上,进行交易。

以打赌天气的例子,这个程序会确保100元的安全,并且一到明天会自动确认天气状况,结果揭晓后,也会自动将100元汇到赢家的帐户里。在区块链网络上的交易,是无法被篡改或终止的,而且适合于大型交易,如卖一间房子或一家公司。

比特币是人们最熟知的采用区块链技术的应用。我们先来说明比特币是如何工作的,在说明过程中一点一点带入区块链的概念。

什么是比特币?

一块比特币就是一个单位的电子比特货币(BTC),并且就像真实的一块钱货币一样,本身是没有价值的,只有在进行物品交易时才会产生价值。

在比特币系统里,有一本帐本(ledger),它是一个电子档案,记录着所有的交易纪录。

img
▲图1 比特币电子帐本

这帐本不是存放在一个中央机构(比如银行),或者一个数据库。它拥有无数份副本,散布存放在区块链网络上的每一台电脑里,而每台电脑我们称为“节点(node)”。

如果David想用比特币转帐给Sandra,他就发送一个信息告诉网络说:他的帐户减5 BTC,然后Sandra的帐户加5 BTC。在网络中的每个节点都会收到信息,并且将这笔交易记录到自己的帐本里,然后更新帐户的余额。

img
▲图2 请求交易信息

说到这里,关于帐本是由一组电脑共同维护,而不是由一个类似银行的中心机构来掌管,有三个启发:

  • 在银行系统中,我们只知道自己的交易纪录和帐户余额,而在区块链网络里,每个人可以知道任何人的交易纪录。

  • 一般来说你信任你的银行,而比特币是分布式系统,运行在网络上,任何事情发生错误,是没有客服人员可以帮你的。

  • 区块链不是建构在信任情感的基础上,其安全性和可靠性是通过特殊的数学函数和程序代码达到的。

我们可以将区块链定义为一个系统,它让一组互联的电脑安全地共同维护一份帐本。

为了能在区块链网络里进行交易,你需要一个钱包(wallet),它让你可以存放和交易你的比特币。只有你可以花费你的比特币,所以每个钱包被特殊的加密法保护着,使用一对独特且配对的钥匙:公钥和私钥,才能解锁。

如果一个信息被公钥加密,只有配对的私钥才能解密读到信息。反之,如果你用你的私钥加密信息,只有配对的公钥可以解密。所以当David想要转帐,他需要用他的私钥将转帐信息加密后,送到网络里,然后每个节点使用David的公钥将信息解开,以确认是由David发送的。

在加密完成时会产生一个电子签名,它会被节点们用来确认交易信息的发送来源和真伪。电子签名内容是一串文字,它是由交易信息和私钥所组成的,所以不能用在其他的交易信息上。如果你更改交易信息中任何一个字节,电子签名也会跟着改变,所以黑客很难更改你的交易信息或是得知交易金额。

img
▲图3 电子签名与加密交易

钱包的公钥其实是网络里的一个地址(send to address),所以当你转比特币给某人时,你其实是将比特币转公钥的地址。而且你必须证明你是私钥的所有人,才能进行转帐。请注意,在网络里的交易信息已经是被加密过的,你不用暴露你的私钥。

每个节点都保有一份帐本,但节点是如何知道你的帐户余额呢?区块链系统并没有记录每个人的帐户余额(注:所以帐本实际上不是图1那样),事实上,它只纪录网络上每笔交易纪录(如下图)。为了得知你的帐户余额,你必须分析和验证所有曾经跟你钱包产生交易的纪录。

img
▲图4 区块链网络的帐本

“帐户余额”的计算和验证需要靠之前的交易纪录。举个例子,为了转出 10 BTC给John,Mary先发起一个交易信息,它包含了之前部分的转入交易纪录,只要这些纪录的转入金额的总和刚好或大于10 BTC,即可发送信息。这些包含的交易纪录称作输入(inputs),每个节点会验证这些输入的金额的总和是等于或大于10 BTC。这些计算和验证会由钱包和节点自动完成,使用者不需要烦恼。

img
▲图5 区块链的交易信息结构

那么,系统如何信任这些输入呢?

它要确认你的钱包在之前所有的转入交易纪录中是否真的有这些输入。为了简化和加速验证的过程,每个节点会保留一份特殊的数据来达到目的,也因为这个验证过程,钱不可能会无缘无故多出来。

持有比特币代表的是,帐本上你还未变成输入的交易纪录。

在比特币网络上执行交易的程序都是开源的,这表示任何人只要有电脑和网络就可以进行交易。然而,程序的错误有可能导致你的比特币会不见。还记得吗?比特币是分散式网络,并没有专属的客服人员替你找回遗失的钱或钱包密码。所以你想要用比特币进行交易,建议使用正式的比特币钱包软件,并且妥善保存你的钱包密码或私钥。

嗯,了解,但它真的安全吗?而且它为什么叫做区块链?

任何人都可以进到比特币网络,并且只需要出示他的公钥就可以进行交易。如果一直使用同一个公钥,所有的交易纪录就会指向同一个帐户。比特币网络允许你产生多个钱包,每个钱包都拥有自己的公钥和私钥。这么做可以让你用不同的钱包做消费。没有一个公开的方式可以知道你是这多个钱包的拥有者,除非你将每个钱包的比特币转到同一个钱包去。

比特币地址(Bitcoin addresses),也就是钱包,的总数是 2^¹⁶⁰或1461501637330902918203684832716283019655932542976。在让任何人都可以拥有钱包的情况下,用这么大的数字可以防止一些可能的攻击。

话虽如此,仍然有一个安全漏洞会被利用:如果把钱转出后马上取消交易。交易信息会在网络里的节点间传递,所以两个交易信息抵达同一个节点的时间会不一样。黑客送出一个交易信息,在等商家把货物寄出后,再送出一个取消交易的信息。这种情况下,有些节点会先收到第二个信息,而把第一个信息视为非法。如何知道交易信息之间的优先顺序?使用时间戳(timestamp),但它容易被伪造。因此这会发生一些舞弊现象。

节点间会为了交易的顺序而意见不合,所以区块链系统设计的一套机制让所有节点可以遵循一致的交易顺序。

比特币网络为了将交易信息排出顺序,所以将它们包成一组,称为区块(block),每个区块包含的若干个交易信息和一个连到前个区块的连接。随着时间,一个区块跟着另一个区块,形成一条时间链,这就是区块链。

img
▲图6 区块链的序列结构

在时间序列上,同个区块内的交易信息被认为是同时发生,还未被打包进区块的交易信息会被视为未确认状态。每个节点都可以将若干个交易信息打包成区块发送到网络上,并建议其为链上的最新候选区块。

因为任何节点都可以发送候选区块,系统如何决定谁才是可以放在链上的最新区块?

区块链系统使用加密哈希函数(cryptographic hash function)设计了一道复杂的数学题,候选区块只要有正确答案,就可以成为链上的最新区块。

这个答案是由节点计算后一起被打包进区块。答案是一个数字,得到答案的唯一方法就是用猜的,猜到对为止。一台普通配置的电脑需要花一年的时间才能猜对答案。所谓团结就是力量,区块链网络里有很多台电脑(节点),一起猜,只需要平均10分钟就可找到答案。

哪个节点先猜到了答案,它就先有权利将它的候选区块放到链上。

要找茬的话:如果两个节点同时猜到答案,同时将各自的候选区块放在链上,会怎么样?每个节点都有一份区块链副本,当节点拿到其他节点丢出来的候选区块(已有正确答案的),就会把区块放到副本链上,同时系统会要求节点搜寻网络里有没有比它的副本链更长的链,如果有,舍弃原有的链,取用更长的链。

img
▲图7 解决链模糊逻辑

事实上,节点同时猜对答案的发生机率很低,所以整个区块链会很快地稳定下来,收敛成单一条链。话虽如此,不一致的链尾区块仍存在潜在的安全问题。如果区块属于较短的链尾上(如图7的区块B),一旦系统决定采用其他更长的链(如图7的区块A和N),则区块B内的所有交易信息会被设定回到未确认状态。

我们来看看Mary如何利用链尾模糊现象来进行攻击。Mary要付钱给John,John要出货给Mary,因为节点总是取用长链执行其上的交易信息,这个时候Mary假造一个更长的链,里面包含了一个取消交易的信息,于是John可能会财货两失。

img
▲图8 Mary的攻击方法

系统如何防止这类攻击?刚提到所有节点会合力找到数学题的答案才能把候选区块放到链上,单靠一台电脑去猜是非常困难,Mary必须比网络上所有的节点更快找到答案,才可能把假造的候选区块放到链上。就算她成功假造了第一个区块,还有第二个、第三个区块,每次都要跟整个网络上节点们做竞赛。如果Mary用一台超级快的电脑呢?因为网络上有大量的节点,Mary不可能在确切的时间点假造多个区块来进行攻击。

如果她控制了网络上一半的节点,她有50%的机率可以成功假造区块,但如果要连续假造两个区块,机率降到25%。想假造越多的区块,Mary的成功机率越低。

比特币区块链系统的交易信息是被数学竞赛保护着:黑客是跟整个网络做竞速。

所以,交易信息随着时间越来越安全。越旧的区块比越新的区块更安全。平均10分钟就有一个新的区块加到链上,大概一个小时后,里面的交易信息有很高的机率已经被执行了,而且是不可逆的。

img
▲图9 区块链的交易安全

为了转钱出去,你的钱包必须先验证有钱转进来过,网络上所有的交易都会经过这样的验证。鸡生蛋,蛋生鸡,但一开始的比特币从哪来?

为了平衡软件错误或钱包密码遗失所造成的通货紧缩,系统会把一些回馈金给解开数学题的节点。为了得到回馈金而去执行软件的行为,称为“挖矿” —— 就像挖金矿一样。

回馈金是一种激励,推动人们去建立节点,顺带贡献一些计算效能来帮助整个网络的运算和稳定。

因为一台电脑需要花很长的时间解题(大约平均一年),所以几个节点可以组成一个群组一起解题。这种方式会比较快,而且平分得到的回馈金。这种群组称为挖矿池(mining pools)。

有些挖矿池很大,可能拥有整个网络超过20%的计算效能。这可能会有安全性问题,就像刚刚Mary那个例子。但就算挖矿池得到50%的计算效能,时间越久,交易信息就越安全。

然而,有些挖矿池会限制节点的数量避免过大的计算效能来保障网络的安全。

而且随着时间整个网络的计算效能会提升,例如技术的创新或节点数量的增加,区块链网络会重新调整数学题的难度,让产生新的区块的时间保持在10分钟。这么做可以促使网络的稳定和安全。

再者,每四年挖矿的回馈金会减半,所以随着时间人们对挖矿的兴趣会减少。为了避免节点停止挖矿,系统允许每笔交易信息可以附带一点回馈金,节点便可以获得额外的利益。

因为这个机制,如果交易信息带有较高的回馈金,就会比较快被执行。这表示你想要你的交易快点被执行,就得附加比较高的回馈金。跟银行的手续费来比,比特币的交易回馈金显得比较少,而且跟交易量无关。

img
▲图10 比特币交易

现在你已经对区块链有一个初步的了解,我们来快速看一下它为什么有趣。

使用区块链技术有几个相当显著的好处:

  • 你可完全控制自己的身家财产,没有第三方机构组织保管或限制你使用它。

  • 交易成本非常低,让我们可以实现小额支付(micropayments)。

  • 财产可以在几分钟内就完成转移,交易纪录可以在几个小时内获得保障。

  • 任何人可以在任何时间验证每个交易纪录,区块链具有高透明度。

  • 应用区块链技术可以打造任何去中心化的应用软件,它可以快速且安全管理和传送数据。

然而,有一些挑战需要克服:

  • 交易纪录都是匿名的。一方面保障了用户的隐私,另一方面管制机构无法追踪非法的交易行为。

  • 即使很多交易平台兴起,仍不容易使用比特币买东西。

  • 比特币就像其他的虚拟货币,非常不稳定:在市场上不容易取得而且需求剧烈变化。比特币的价格很容易受到虚拟货币市场的突发事件影响。

  • 区块链技术还处于起步阶段,每天都有新的发展让区块链更安全且稳定。

整体来说,区块链技术在许多行业上也具有潜在的革命性,例如从广告到能源。它的主要影响力是源自于去中心化的概念和无形的信赖,很多的应用正在发展中。

四. 参考资料

区块链入门

比特币入门

加密货币的本质