来源:Filecoin官方 编辑:Cecilia 事件回顾 2020年12月19日,Filecoin网络经历了链上中断,这意味着可以在一段时间内创建新的区块,但矿工无法就产生的状态达成共识,每个区块计算出不同的价值。由于社区成员、矿工和开发人员之间的快速响应——在四个小时内发布了修复程序,并且实现了网络在七个小时内完全恢复。 中断原因 潜在的问题是对存储矿工参与者实现中的对象映射进行潜在的不确定性迭代。参与者在Go中实现。众所周知,对Go映射的迭代是不确定的,并且参与者在使用迭代之前实施了始终对迭代结果进行排序的模式(强制执行静态分析)。不幸的是,两个映射在进行排序时使用的比较函数中的错误导致排序无效。因此,不同的节点以不同的顺序处理map条目的顺序不同,从而导致不同的结果和Gas消耗。 该代码路径实际上只有通过(a)一个矿工声明多个扇区立即终止,或(b)一个矿工立即恢复跨越多个分区的故障,才能到达此代码路径。(其他两个代码路径到了这一点,但实际上极不可能)。在此之前,主网中都没有使用这两种路径,没有将多个扇区作为数据,从而暴露了不确定性。所以多个扇区的同时终止引发了这一中断。 Filecoin参与者的测试涵盖了所讨论的代码,但不包括验证不同测试运行时确定性执行的机制。Lotus节点实现的集成测试未涵盖终止多个扇区。 中断影响 虽然发生了这样大规模的时间,最重要的是,在中断期间没有丢失任何数据。虽然无法创建新的数据块暂时抑制了网络上的交易,但存储供应商提供的所有数据都是安全的,并且一旦网络恢复运行就可以使用。此外,值得注意的是,即使在链中断的情况下,Filecoin协议的规范也提供了数据检索。因此,尽管在事件持续时间内不可能进行链上交易,但Filecoin网络的核心功能仍保持不变。此外,已采取的修复措施确保采矿作业本身不会因停机而受到处罚;取而代之的是,为了降低优先级并鼓励网络恢复,暂时降低了共识削减。 快速应对 首次发现,识别,修复和部署速度也很明显: ● 事件发生后十五分钟内,自动监控触发了警报; ● 在三十分钟内,矿工和实施开发人员聚集在一起; ● 在四个小时内,开发人员确定并发布了此问题的修复程序; ● 在七个小时之内,足够多的节点采用了此修复程序,以通过多数共识的功率阈值,使网络恢复。 对于刚发布的分布式存储网络而言,这个响应的速度令人难以置信。即使建立blockchains经历链断和分叉,Filecoin解决这个事件时间可以与已经运行多年的区块链相媲美。整个社区应该为处理此事件的速度感到自豪。 只有在世界各地多个团体的共同努力下才能实现这种修复。整个生态系统中的各方进行了协作以实现这一目标:矿工发现并报告了该问题,引起了开发人员的注意;工程团队进行协调,以针对潜在问题发布经过同行评审的补丁程序,同时通过社区渠道传达此修复程序的状态;全球各地的网络参与者都在努力应用补丁程序,并使网络尽快恢复在线。虽然如此紧急的事件不会再发生,但这是Filecoin生态系统内参与度和专注度最令人印象深刻的展示。 下一步将会做什么 建立区块链就像造火箭。它们是非常复杂的技术,因此很难在第一次尝试中就将所有事情都做好。就像真正的火箭一样,事情可能以意想不到的方式出错。当发生这种情况时,重要的是要有适当的基础架构以尽快解决问题,最大程度地减少影响并减少再次发生问题的可能性。 为了达到这个目的,多个团队进行了事后验收的编写和执行,确定了对参与者的测试覆盖范围以及网络基础设施/通信的警报和问题升级的其他改进,以帮助减轻未来可能发生的事件。 由于Filecoin社区成员的辛勤工作和投入,这种新颖技术的缺点不断得到解决。在发现并解决所有问题后,网络将进一步发展成为一个稳定、可靠且经过验证的平台。 —- 编译者/作者:大陆节点数据中心 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
12月19日Filecoin链上中断事件始末及改进方案
2021-01-20 大陆节点数据中心 来源:区块链网络
LOADING...
相关阅读:
- 行而不辍载誉而归盘点荣泰产品2020年的那些奖项2021-01-20
- 基于大米的稳定币将在印尼推出–新闻稿比特币新闻2021-01-20
- 瑞波币希望乔·拜登的新政府可以挽救这一天,杰德·麦卡勒布(Jed Mc2021-01-20
- 去中心化新媒体MoomWorld横空出世势将打破资本对话语权的垄断2021-01-20
- 星际联盟:分布式存储是人类社会发展的必然2021-01-20