LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 行情分析 > 先东独家区块链分布式云存储Filecoin的进化史

先东独家区块链分布式云存储Filecoin的进化史

2020-05-28 IPFS先东科技 来源:区块链网络

01

2017年?—— 2019年2月13日

这个时间,是大多数人分不清楚IPFS和Filecoin的区别的时间段,也是大部分人相信Filecoin挖矿就是组装存储服务器的时间段,更是认为硬件优势就是核心优势的时间段。

那么在这个时候所谓的IPFS服务器或者是Filecoin的矿机,表面上看着是很多设备搭配着服务器外衣,但是却安装的的是PC端的内脏。

给外界一种感觉,就是外观是2U/3U/4U的机架式服务器,但是里面的主板插的却是台式机器的CPU,以及不带ECC纠错功能的内存条。

更有的矿机服务厂商,采用J1900这款赛扬CPU的低端机器在当时有一段时间是占了这类机器数量的很大一部分,甚至成为某些骗局盘子的门面招牌机型。

那么这些机器,内存从1GiB,2GiB到8GiB的都有,很少有超过16GiB的配置机型。

做这样的配置的原因其实很简单。做存储嘛,关键点在于大量的硬盘能存更多的数据,不像比特币那样做很多无意义的高耗能的HASH计算。

当然,这也是事实。实际上呢,大量的NAS硬件设备,甚至很多的企业级的NAS设备(高性能的分布式存储除外),对于CPU的性能和内存真的没有太高的一个要求。能存数据就好啦。。。。

在这个时间节点里的每个矿机服务厂商,都说自己掌握了Filecoin的核心算法技术,都说自己比其他公司靠谱。

但是更多投资者大家更加关注的是“性价比”——谁家的机器便宜?谁家的单TB成本最低?等等一些不确定因素

不过,也有很多矿机服务厂商,连在测试网时期都没有成果,就已经直接宣布跑路了。

当然,这里面也有很多的矿机服务厂商,也算是稍稍微微有点良心的公司吧,把机器直接转型,进行相应的升级及改装,就去挖其他币种了。

但是不管什么样配置的机器设备,总有可以挖的出Filecoin的,只是产量的问题嘛——如果实在找不到项目可做,也可以自己公司发个币嘛。

就像目前当下的很多矿机服务厂商一样,就是这么干的。当然在这个阶段,协议实验室也隔空警告大家:不要买所谓的mining machine。

02

到了2019年2月14日?——?2019年11月底

Filecoin的代码总算公布了。虽然Bug很多,但作为一个伟大的国际性项目,大家也都可以理解,也猜到了它的上线过程,肯定是长期又曲折的。

事实上,和其他区块链项目相比,我们每天都可以看到它的代码和文档更新,也可以从各个角度来“感受”它的算法,了解到它的一个活跃度。

但这时,很多人发现了一个不对劲的事实。不对劲啊!怎么花在计算上的时间比存储上的时间多呢?

用一台普通的机器,1GiB的数据,真正写入硬盘只需要几秒钟(如果是RAID可能更快),但做复制证明的Seal操作,要耗费几十分钟?这个不是一个存储项目吗?

这就引出来了一个很严重的问题:以前配置很低的机器设备,比如J1900,看来是不行的了。

配置是有点低的,至少做Porep的Seal操作是不行的,要知道,Sealing操作可是整个Filecoin挖矿过程中的最耗费时间的步骤,如果要利用旧机器去做也不是不行,就把它们当成一个个存储柜吧。

稍微好一点点的配置,仍然可以发挥余热。但是新加的机器,配置至少要更强劲一点。干脆就多来点服务器的CPU吧,内存在稍微大一点点吧。

慢慢的,二手服务器也进入了这个市场,入门级的至强E3,淘汰很久的至强?E5645等等一些CPU,E5 2600系列v1和v2 的CPU,都大批量涌进来了,内存大小也慢慢地以16GiB为主,当然开始也有32GiB的出现。

大多数人已经认为硬件配置已经很高了,都到达了32GiB内存了,再高的话,那就是要逼人造反了?!甚至有一些人还吵着说,这个Filecoin还是不是存储项目了?怎么偏离方向了呢?

但是,自然界中每件事物的发展方向,是不会以人的意志为转移的。就像我们觉得股票已经跌得很低了,不能再跌了,所以才舍不得卖,但是到第二天才发现,他跌倒了一个新的低点。

如果真觉得这个硬件配置高,我们过半年再回过头来看,就会认为自己犯了一个经验主义的错误。

但是还是有人通过技术的敏感程度,来推测到后续的硬件要求会越来越高,硬件配置好一点,在性价比方面至少并不会吃亏。

就比如说,至少采用E5 v3系列的服务器的CPU,在支持avx2指令集等特性的情况下,拥有比v2更好的性能,也具有更高的性价比。

那么也就是到了这个时间节点,很多人慢慢的感觉到,容量大小并不是唯一的,甚至容量大小就不是一个问题。算力(power)积累速度,也就是我们说的“有效存储”的增长速度才是最为关键的。

不然的话,你拥有再多的硬盘存储空间,也看到的只是别家公司所跑得快的人在分钱而已。

所以我们需要存储,而且还需要快速的存储,我们光有硬盘是不行的,我们得遵循协议的规定把它存满才可以,所以你存数据也得快速的存储,这就是技术跟软件的优势了,这就是我们先河系统的优势了?从测试网中我们大概也可以看出一二吧。

那么紧接着官方的算力排行榜开始慢慢的出现了。整个全网各个矿机服务厂商在营销这个方面的手段也全部都升级了,从最开始的纯脆宣传自己技术强,技术给力,慢慢就?上升到了说自己可以上榜。

所以就出现了目前市场上很多的“第一名”。说啥的都要。但是因为网络代码本身协带的很多Bug,这个排行榜没有得到实质性的价值,所以关注这个排行榜的人也并不算多。

而且,几乎全网所有参与测试网的矿工们意识到一个问题。就是就算有了机器硬件设备,如果想要把Filecoin跑起来,哪怕就是简单的编译和运行起来,都不是一件非常容易的事情。

如果想要把整个网络跑得更好,更加稳定,更加安全就得需要自己去修改代码。从最底层进行优化跟改善,这些都需要大量的研发资源,以及技术沉淀。所以一般的公司根本做不了??都是为了卖服务器而卖服务器。

所以,矿工们慢慢开始意识到,软件、系统、运维、持续不断地迭代,比只谈硬件要重要的多的多。因为官方的代码都每天都在变,不跟着测试网迭代参与测试的公司谁给你们那么大?的信心去挖Filecoin呢????

到了2019年11月底?——?2019年12月12《这里说的是国内时间,太平洋时间是12.11日》日测试网一阶段上线前,协议实验室突然宣布,说了一句:“挖矿硬件设备需要GPU。”

这个事情一说出来在整个市场引起了巨大的波动。因为整个市面上从2014-2017年这个阶段就有将近数十亿的服务器在屯着,当初都是以CPU的形式去屯着,要去升级这些硬件设备需要很大成本,在加上这些人又不是专业的人,所以官方这样一说无疑是给他们这些人设了一个难题。

其实GPU对于复制证明和时空证明的加速,一直都有技术人员在研究,在拥有GPU的情况下,确实快很多,但为了网络更安全稳定,协议实验室直接引入了两个重大的改变,对硬件设备的配置要求也快速的增加,而GPU从最初的选配几乎变成了标配:

在出块的时候,采用了选举证明(Election PoSt)。为了在一个区块高度内完成(最好是半个区块内就要完成),协议实验室建议使用GPU。

也就是说,如果不用GPU,即使你有算力,也很难有FIL产出!如果是这样的话那不是白忙活了吗?

因为小容量扇区不安全,所以主网上线的时候,仅支持32GiB的扇区。虽然目前测试网支持1GiB扇区,但硬件标准至少要向32GiB扇区看齐了。

到了2019年12月12日测试网上线?—— 现在为止,测试网上线之后,Filecoin的行业格局有了一些变化。至少所有的人都会盯着官方的算力排行榜以及出块效率、FIL产出等参数了。

其实呢,这些仅仅都只是数字而已,并不能代表什么。我们一定要以链上数据为主,但是呢,要获得这些数字,的确还是需要很多的投入、研发的投入、以及设备的投入等等。

虽然我们说Filecoin的市场可能会很大,众多矿机服务厂商能够一起瓜分这块大蛋糕,但是厂商之间的竞争,也在这个时间段演的更加火热。

有各种榜首之争,各种吹捧和诋毁的文章以及媒体报道,以及很多的新的创世之作。说什么的都有,有说刷榜是没意义的,有说上不上榜至少可以说明没有技术;

有说你的成本高,有说我的技术牛……当然,这些都很正常,因为作为一个Filecoin爱好者,而你不去宣传他,当然是很不应该的。

在主网上线的时候,自然见分晓,所以考察一个公司有没有技术实力是一个长期的过程来的,而不是一朝一夕可以完成的。

当然伴随着测试网所带来的一个重大的变革就是是:集群挖矿模式可能在前期会成为主流。那么单机挖矿模式和集群挖矿模式,到底哪个会更好,谁的效率及稳定更好,整个市场上说什么的都有。

很多个机器用不同的账号,看上去抵抗惩罚能力会更强,而且挖到的Filecoin的总量也不一定少;

但是集群的话,需要很多额外的开销用于内部协调,稳定网络,而且内网数据传输也可能导致瓶颈,但是算力累积会很快,最起码的可以很快的达到官方设置的出块算力高度。

因为我们前面讲到Filecoin的产量必须是“有效存储”,影响产量的也是有效存储,所以我们空有硬盘的存储空间是不可以的,必须按照协议的规定把它存满,而且是“快速”的存满有效数据。

所以有一个非常重要的原因,让全网所有的矿机服务厂商都不得不使用集群:因为更大的总算力,更容易上榜,而且在算力、出块率、爆块率、获得Filecoin产量等方面,可以取得排名靠前的一个优势。

但是集群挖矿模式的话,每个矿机服务器厂商的实现方式都是不同的。再加一个不断涨价的2080Ti型号的GPU显卡,已经让人非常疯狂了。

《GPU是啥?GPU 技术在系统底层重新设计了图形处理框架,实现了软硬件协同,使得?GPU 图形处理整体效率得到大幅提升。》

所以对于投资者也意识到了?,Filecoin的硬件设备的非存储因素占据的成本比重也会跟随者市场热度以及项目本身的成熟进度越来越高。

当然,还有一些矿机服务厂商继续不段的提升单台硬件设备的算力增长率,选择采用一些更为高端的硬件设备。比如说用很多张GPU显卡同时使用,采用更好的CPU和更大的内存。

但是这样搞的话算力是变多了,成本当然也变高了,是否会更有性价比呢?当然呢,针对特定版本的一些程序来说,的确是有效果的,但是前提是必须要有大量的代码级别优化,把GPU的并行性发挥到极致。

如果觉得这个效果还不够?那么就只能上FPGA了,它可以针对特定的运算实现优化;FPGA做好了,甚至还可以做ASIC芯片。但是就感觉有点好像走BTC矿机的成长时候的道路了。

况且这些东西,的确是要有技术含量的,更加不是那么容易做出来的。不但如此,而且还需要付出的不仅仅是硬件成本代价,还有更多的研发成本。这是目前全网各家公司大多数没有的?也是做不了的。

03

再到2020年新冠病毒疫情发生之后

几乎所有人都在讨论是否是新冠病毒在导致Filecoin测试网第二阶段和主网推迟,而就在这个时候,协议实验室的技术团队已经在夜以继日地频繁更新代码。进行升级,优化,等等。。。就这样代码又发生了很多变化。

其中一个比较大的变化是,在复制证明的Precommit阶段,winSDR算法改成了SDR算法。之前的winSDR是把数据按128MiB分成了一个个window,这样可以通过并行计算的方法来加快计算速度。

但是呢,这个算法是不安全的。比如,利用GPU等设备,可以做到更大程度的并行性,三下五除二,就可以把它搞定。这样就给链的安全带来隐患。

但是改成SDR之后呢,可以解决过度优化带来的负面作用,相关的计算只能串行操作,虽然时间加到更长了,但安全隐患大大降低了。

安全性的提高是用更多的计算成本这个代价来换取的。32GiB扇区的计算是机器是最耗费内存的,并发任务多,需要的内存量就加大,连做基因计算的胖节点的内存都没有这么大!

我们先不讨论主板到底有没有那么多内存条,在疫情开始了以后,内存价格的疯了似的往上涨,已经让这些矿工疯狂啦!

为了让所有矿工更安心的接受SDR,协议实验室的技术团队只能拼命工作。没日没夜加班,正所谓,只要功夫深,铁杵磨成针,皇天不负有心人,Sealing的计算时间是可以加快那么一丢丢的。

但还是很慢,于是呢,就想到了看怎么榨干CPU的性能。在SDR过程中,计算每个node,用的是SHA256哈希计算(就是比特币的那种哈希算法)。有没有新的办法,在不依赖于新的硬件的情况下就能给它加加速呢?

嗯,有了,就用SHA扩展,通过新增的指令,最大程度提速SHA256的计算。但是试了一段时间,有点不对劲,这个SHA扩展好像是Intel提出的,但Intel的桌面CPU和服务器CPU都不支持,倒是AMD的CPU支持得很好。

不过,这个也不是问题,因为协议实验室开发人员用的工作机器,就是AMD的线程撕裂者。自己的机器,自然要最先优化啦。虽然CPU价格超贵,但用起来超爽。

这就是为什么目前市面上大量公司利用AMD的线程去测试,如果算法一改,那么这些硬件的机器性能将不会再占有优势,性能也会不同比例的下降。

道高一尺,魔高一丈。上有政策,下有对策嘛对嘛?但还得必须想一些黑科技的法子,突破这些技术瓶颈。

也许有。不过,不要紧的,算法是死的,人是活的,可以再变算法。就比如在目前的Testnet 2 阶段测试网中,算法还是会变得。那主网上线了呢?

技术更新的步伐以及软件迭代也是不会停止的,可以随时分叉嘛。因为我们经常说不会有一种技术可以永恒,我们永远也不可能利用现有的技术去预言未来某一天会发生什么样的事。

也没有人可以做到,都是需要强大的技术支撑,以及软硬件协调,系统运维等等的支撑才可以支撑如此强大的体系。

就比如说我们熟知的阿里集团,不也是靠这些因素支撑嘛?大家可以回想一下。但是如果一直变难道不会有很多不满的情绪吗?比如,诸如成本、性能、能耗之类的指责。

这些问题肯定都是有的。但协议实验室也很明白。他们也想优化,也想适应更多的硬件设备。但无论如何,“链的安全性、稳定性、效率性”才是最重要的。前进的道路上本身就是争议之路。

就像前面说的,哪家牛逼的企业不是这样过来的呢?但如果链不安全,比如,一个矿工占据了绝大多数算力,那这个链就完蛋了,所有人的一切努力都会归零。

所以,再多的抱怨,都只能为安全让路。还是那句话:给Filecoin以矿机,而不是给矿机以Filecoin。

讲到这里呢,我们今天的分享也就接近尾声啦,但是说个题外话哈,大家思考下,就是:同样的价格,节点越多,性价比也会越高吗?

答案是不一定的喔,如果CPU、GPU、内存等一些硬件设备存在较大差异,同一个节点,那么它的算力累积的速度可能会相差几十倍。

同样配置的硬件,为什么价格不一样?

“因为软件优化是决定Filecoin产出的核心因素。同样的硬件设备,如果运行的代码不一样,对硬件的优化可能就会存在天壤之别,在稳定性、安全性、效率性等方面也会有很大的差异的。”

现在内存、芯片、主板、GPU等相关价格已经涨了这么多,那主网硬件标准如果敲定了,相关硬件价格是是不是也会继续疯涨?

当然风险和收益是密切相关的。提前确定硬件,虽然有可能会更便宜,但是存在着针对新版代码的算法无法做到最优化的风险(尤其是最近的频繁改动)。

这一点对于目前市场上这些洪水摸鱼的公司可能管用,但是作为全亚洲区两次协议实验室,在全球举办的世界交流会唯一一个参与的技术团队,而且所有的核心技术机制、源代码等等都是由我们技术团队去给贡献的;

如果连他们参与技术底层的技术团队,所针对整个Filecoin底层代码所搭配起来的服务器都挖不出来的话,大家告诉我,还有哪家可以挖得出来???

每个人对风险的预估不一样,这个只能大家自己决定,见仁见智了。

我的设备的配置低,是否也能参与到Filecoin挖矿?看怎么定义挖矿了。如果把证明部分外包,很多时候也可行,就是看性价比及产量的问题了。

未来硬件配置会持续变高吗?也许会。但是那也是是在有可能链被认为足够安全了,准入门槛开始降低的时候。但那也是未来的事情啦。

—-

编译者/作者:IPFS先东科技

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...