LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 区块链资产 > YottaChain王东临: 数据的加密和去重是区块链存储的两大关键技术

YottaChain王东临: 数据的加密和去重是区块链存储的两大关键技术

2019-10-16 李先生poc 来源:区块链网络
楔子

YottaChain是由国际顶级科学家带领的专业团队打造的,通过连接分散的存储资源,构成一个具有自修复能力的规模浩瀚的全球共享的统一存储池,确保每个人的数据主权,在存储效率、数据可靠性、数据安全性和存储成本等方面都做到极致。

1571224327151893.jpg

存储是区块链最佳落地应用场景

1.存储本身就是有去中心的要求

有的项目加区块链是生搬硬套,其实加上区块链和不加区块链没有本质区别,而存储不一样,因为存储的中心化已经到了极致了。去年腾讯云因为硬件故障加运维人员操作不当把用户的数据丢了,再也找不到了;

微软在德克萨斯的数据中心被天打雷劈,制冷设备被雷电劈坏了,导致服务器过热,停止服务了20多小时,这对美国的很多服务造成了很严重的影响。这些例子都说明单一数据中心的可靠性已经到了极致。要防止每一个这样的小概率事件,进一步提高可靠性,这就需要去中心化,靠地理位置的分散来实现故障域的进一步隔离,从而提高可靠性。

去中心化是能够极大提高容灾能力,以及抗DDoS。现在DDoS攻击的难度越来越低,市面上购买几十G流量很便宜,很多网站都经不起这么大流量攻击。但是去中心化存储,区块链的存储,他是天然的抗DDoS,全世界几百万个节点,其中几十个,几百个甚至几千个节点被攻击了都没有问题。同样,区块链存储还拥有容灾方面这个奢侈特性。

2.存储有一个数据去重的特性

可以将存储空间放大很多倍,用户越多数据越多,则放大倍数越大。

3.区块链的激励可以激励矿工加入

可以激励用户使用,无需巨额投资即可迅速在全世界招募众多矿工节点加入区块链存储系统并吸引大量用户使用,很快形成规模,从而构建一个规模越来越大用户越来越多、可靠性越大越高成本越来越低的存储系统。

例如,一个拥有100GB存储空间的人,如果用来存自己的数据只能存100GB,但如果将该存储资源贡献用于挖矿,再利用挖到的数字货币购买存储空间,将可以储存200GB的数据,并且富余很多数字货币。这种方法可以储存更多的数据且让人获得很多额外的数字货币,可以有效地激励存储资源的拥有者加入系统挖矿。

4.存储是数字形式存在的实体经济

既是物理的,又是数字的,所以存储可以无需任何中介直接tokenize,是区块链直接连接物理世界的很好的应用场景。其它很多领域都存在一个严重的问题,链上数据固然无法篡改,但谁能确保上链的数据是真实可靠的呢?区块链存储就可以完美解决这个问题。

5.区块链存储至少两个方面的优势

相较于中心化存储,区块链存储在持久化存储和网络加速这两个市场上都有压倒性的优势,这两个市场的规模达数百亿美元,足够大。

6.区块链存储或能超越AWS这样的中心化存储的规模

就像滴滴自己可以没有一辆车,但很快成为中国最大出租车公司一样,这种去中心化的轻资产的模式很容易扩大规模。区块链存储也是类似的性质,完全可能在将来超越AWS这样的中心化存储的规模。

决定产业格局的加密去重技术

在IPFS/FileCoin或迅雷玩客云这样的区块链存储系统中,主要面向的是网络加速市场,规模不到100亿美元,而实际上持久化存储的市场规模更大。

很多人都以为矿工的存储成本不可能低于AWS/Google/阿里云这样的超级大玩家,所以认为区块链存储的成本要高于中心化存储,这个观点是错误的。实际上,区块链存储的成本是完全可以更低的。

1.数据去重技术使得存储相同数据占据的硬盘空间减少5-10倍,存储成本大大降低;

2.每个存储节点可以只有很少的存储设备,不需要专门的制冷系统(占数据中心耗电的三分之一甚至一半),靠自然通风即可散热,这样整个系统的CapEx和OpEx都大幅下降;

3.对设计得比较好的区块链存储系统来说,绝大多数存储节点无需专业运维工程师驻场,每个节点都自动化运行而且一旦有意外故障失效会有其它节点自动顶上,节省了昂贵的运维费用;

当然,区块链存储系统设计得不够好的话,不见得能具有刚才说的那些优点。例如IPFS,到现在为止的版本,其数据可靠性还远远不如中心化存储。IPFS是为CDN用途设计的,CDN的特点是不在乎丢数据,只要热点数据被缓冲了就好,CDN没了数据就回源,根本无所谓。但是这样的系统如果用于持久化存储,就是灾难。

这就要介绍YottaChain区块链存储的两大关键技术:数据加密和数据去重。

数据加密

对于大公司(例如AWS、Google、Dropbox)提供的中心化存储来说,数据加密是一个亮点,但不是必须的。因为用户可以信赖大公司的品牌、内控体系,指望大公司不会作恶即使事实上这一点并不是那么可信。对于去中心化存储来说,数据加密就成为存储个人和企业数据的必备要求。

源代码是开放的,每个存储节点都可以自由访问。所以个人和企业数据都必须做数据加密,而且是“零知识”的数据加密,即除了数据所有者或其授权者外,其他任何人(包括存储节点的拥有者、系统的设计者和开发者)对该数据都一无所知,即使作恶也无法窥视数据。

经常会看到一个说法,说中心化的服务(例如百度)经常会侵犯用户的数据隐私,所以要去中心化,就可以解决这个问题了。这个说法是非常错误的。实际上,去中心化之后这个问题更严重了。中心化存储时有一个人可以偷你的数据,去中心化之后就变成人人都可以偷你的数据了。

所以,零知识数据加密对区块链存储是至关重要的,甚至可以说是决定性的。

数据去重

如果多个人拥有相同的数据,不重复存储而是合并共用同一份空间,称为“去重”(即去掉重复数据),也称为重删(即重复数据删除)。

注意数据去重和冗余存储是不同层面的概念。即使是去重后只存一份数据,这份数据也必须用冗余编码分成很多碎片,分别保存在多个不同节点上,就算其中有部分节点数据丢失也不影响数据的完整性。这么多个节点上存储的碎片合起来称为一份数据。

这两个概念之所以有时候会产生误导或混淆,是因为有一种最简单的冗余算法是多副本存储,例如IPFS。这种情况下,多个用户拥有的相同数据会通过去重而只保存一份,但这一份是有多个副本。

数据重复率与用户数和数据量呈正相关:若用户数越多,数据量越大,则重复率越高。数据重复率越高,去重之后的平均存储成本就越低。如果平均数据重复率是10倍,则1GB空间平均可以存储10GB的数据,平均存储成本降低10倍。

前面介绍的区块链存储的强大激励模型也是建立在数据去重的基础之上的。通过全球数据统一去重,将数据去重率提高到极致,相当于一块硬盘变成10块盘,2块用来存数据,8块用来赚钱。

数据加密和数据去重都对区块链存储起到决定性的作用。但现在有一个核心关键问题,即加密去重不可兼得的问题。

在行业中存在一个“公知常识”:数据加密后不能去重。即零知识数据加密与数据去重二者不可兼得,最多只能选一个。一个表面的原因是数据加密后就变成乱码,无法识别数据重复。这其实并非问题的关键,完全可以保存数据明文的hash值,通过比较hash值来识别重复数据。

这个解决方案仍然存在很多坑,例如假冒Hash值进行攻击,但这些坑还都有办法解决的。加密后去重的核心问题在于数据的授权。即A存储的数据,当B也要存储相同的数据时,如何将A的数据授权给B使用而且还不影响A的数据安全性。

既然是零知识加密,怎么可能让B能够使用A的数据呢?所以大家都认为是无解的,零知识数据加密与跨用户数据去重二者只能选一个。

在这种情况下,IPFS选择了数据去重,牺牲了数据安全性,这就是IPFS设计用于存储网页等公开数据的真正原因。有一些区块链存储项目选择了数据加密,牺牲了数据去重,虽然保证了数据安全性,但存储成本大幅度上升,而且牺牲了一种极其有效的激励模型。

1571224327772472.jpg

YottaChain鱼与熊掌兼得,世界上唯一能实现“加密后去重”的技术,拥有全球专利!拥有区块链存储的核心技术也必然在存储市场占据不可替代的龙头地位,11月20日将会启动主网,12月下旬创建存储池,发放第一批存储配额,首批参与的矿工都将获得前期超高的奖励。

武汉蜜蜂昊宇科技有限公司作为YottaChain超级节点之一,一直都在积极配合项目推广,更牺牲了部分利益将存储服务器价格降到极致,性价比在超级节点中最高,这让更多的矿工朋友都可以参与进来,共建YottaChain存储生态。也欢迎各路矿工朋友到公司来探讨合作。

地址:武汉光谷软件园

—-

编译者/作者:李先生poc

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...