以太坊矿工吵着要上的ProgPOW到底是个啥?

以太坊君斯坦丁堡硬分叉再起波折。由于以太坊改进提案(EIP)1283被发现重大安全漏洞,本计划在区块高度7080000处进行的君士坦丁堡硬分叉被延期,预计要到下周一(1月21日)举行。

本次硬分叉除了改进以太坊性能,最引矿工和投资者瞩目的就属于太坊区块奖励从3 ETH减少到2 ETH以及将难度炸弹延迟12个月。

而此前备受矿工关注的ProPOW虽然在1月4日的以太坊核心开发者的会议上被开发者们同意引入,但并不在君士坦丁堡硬分叉实施。

君士坦丁堡硬分叉协调负责人Afri 5chdn表示,在宁静阶段开启之前,大约在2019年10月以太坊会再实施一次硬分叉——伊斯坦布尔硬分叉,并在伊斯坦布尔硬分叉中引入ProgPoW机制。下一次以太坊核心开发者会议中对ProgPoW算法进行决议。

虽然以太坊自一出生就带着抗ASIC属性,但部署ProgPoW算法也引发了争议,矿工、矿机制造商、开发者均卷入其中。

矿机商指责ProgPoW开发团队成员可能被GPU芯片制造商英伟达(Nvidia)资助;ProgPoW团队主要成员否认;以太坊矿工强烈要求部署ProgPoW算法提高GPU挖矿效率,避免算力集中在ASIC矿机商手中,应对以太坊区块奖励减少;有开发者宣称用ProgPoW客户端分裂ETH。

那么引发以太坊社区热议的ProgPoW到底是个啥?ProgPoW何以能缩小GPU挖矿与ASIC之间的差距?要知道这些答案,需要知道ProgPoW具体对Ethash做了哪些改进。

Ethash算法

PoW是一个概念统称,有很多种算法实现。目前以太坊使用的具体PoW算法是Ethash,它是Dagger—Hashimoto算法的变种。

Hashimoto算法采用IO饱和策略来对抗ASIC,使内存读取成为PoW挖矿过程中的限制因素。Dagger算法使用DAG(directed acyclic graphs—有向无环图)来同时实现内存难解和内存易验证两个特点。主要原理是挖矿过程需要存储完整的DAG数据,同时在计算每个nonce时需要抽取DAG中的部分数据。

选取这个算法的结果使得,挖矿计算性能的瓶颈在于内存大小和内存带宽,而和哈希计算能力关系不大。比如NVIDIA GTX1070执行Ethash时,内存在达到88.3%的利用时,作为显卡计算核心的SM(streaming multiprocessor)只有27.7%的利用率。

同时使得通过大规模部署共享内存的ASIC矿机并不能带来在挖矿效率上同比例线性增长。

Ethash算法的一般流程如下:

1、首先根据块信息计算一个种子;

2、使用这个种子,计算出一个16MB的cache数据。

3、通过cache,计算出一个1GB(初始大小)的数据集(DAG),DAG可以理解为是一个完整的搜索空间,全客户端和矿工需要存储完整的DAG,

4、挖矿:需要从DAG中重复随机抽取64次数据拿去和其他数据计算mixhash

在早期Ethereum和Solidity智能合约代码中,Keccak和SHA3是同义词。在2015年8月NIST标准化SHA3后,标准的SHA3和Keccak算法有所区别。为了避免和NIST标准的SHA3混淆,现在的代码直接使用Keccak作为函数名。

每次Ethash从DAG中随机取64128 bit=8192 Bytes数据。以GTX 1070显卡为例,带宽为256GB/s,那么每秒能承受256*1024*1024*1024/8192=33554432次Ethash运算,即33MH/s算力。

针对Ethash的专用ASIC

可以根据需要执行的命令量身定制专用硬件来解决,比如在Ethash开始和结束时调用的哈希函数Keccak在ASIC上可以更有效执行。

针对Ethash,专用ASIC大致可以采用三个专用功能来提高计算性能:

一个从DAG导入数据的高带宽内存接口(一般来说是GDDR6或者HBM2)

一个用于Keccak哈希计算的keccak引擎;

一个用于执行内部循环FNV和地址模运算的小型计算核心;

由此专门定制的ASIC将比现有GPU体积更小且能耗更低。高配置(GDDR6或者HBM2)的以太坊ASIC矿机可以达到GPU矿机挖矿性能的2倍。

事实上,大矿机商都曾推出过以太坊ASIC矿机。2018年4月比特大陆推出以太坊ASIC矿机E3,芯动科技2018年7月发布以太坊ASIC矿机A10。但因为以太坊社区抵制,威胁可能会修改算法,同时还有部分技术原因,比如比特大陆的E3因为采用的是DDR3内存,ASIC矿机相比GPU并没有多少算力优势。因此,以太坊ASIC矿机并没有得到大规模采用。

目前比特大陆的E3在官网上只有二手矿机出售,芯动科技官网也没有A10 ETHmaster矿机出售。

ProgPoW做了哪些改变

ProgPoW,是Programmatic Proof-of-Work的缩写。正如文章开头所说,为匹配现行主流GPU的硬件特征,ProgPoW算法主要做了如下改进:

1、把keccak_f1600(64字节的字)改成keccak_f800(32字节的字)。32字节是目前主流GPU一次操作处理的实际位数。

2、在主循环环节增加了数学随机序列。目前GPU计算核心内有着大量暂存器,可为高吞吐量可编程数学单元提供信号。Ethash的内部循环先是DAG载入,然后用FNV将数据合并为小的混合状态。ProgPoW添加了一系列随机数学指令和随机缓存读取,进而合并为更大的混合状态。

3、DAG数据读取大小从128 byte增加到256 byte。当前主流GPU DRAM均为32位(32*8=256 byte),这样ProgPoW可以在当前DRAM设备上更有效率地执行;

4、GPU具有少量高速暂存器内存,允许快速处理访问随机地址,ProgPoW也利用了GPU这一特性。

其中迭代运算次数即访问DAG次数保持不变,与Ethash一样仍是64次。

经过优化后,ProgPoW能大幅提高GPU计算能力。Nvidia GTX1070运行ProgPoW测试结果表明,在内存利用率达到87.55%时,GPU计算核心的SM(streaming multiprocessor)利用率能达到87.95%。

ProgPoW大幅缩小ASIC和GPU间性能差距

理论上,还是可以制造出专门用于执行ProgPoW的ASIC的。但这种ASIC不仅需要高带宽内存接口和小型Keccak+KISS99引擎;还需要具有大型寄存器、大量随机数学能力的计算核心;高吞吐量、低延迟、大存储的缓存。

造成的实际后果是这种专用ASIC会和与现有的GPU非常相似。经过优化后的ASIC计算性能将只有目前GPU的1.1-1.2倍,大幅缩小ASIC和GPU之间的性能差距。

考虑到研发ASIC的巨额成本以及以太坊社区的抵制,研发以太坊ASIC极低的性价比也会让矿机商主动远离以太坊。

事实上,要不要抵制ASIC本身也存在争议。因为在有些人眼里,GPU也是某种形式的ASIC。可以预料的是,算力战争不会终结。

因为算力是加密世界权力之源。

发表评论
加载中...

相关文章

切换注册

登录

忘记密码 ?

切换登录

注册

获取

注册奖励 1888 CFC