朋友,你被封过号吗? 你被禁言过吗? 你被盗过号吗? 你曾经丢失过各种数据吗? 你接到过不知哪里来的推销、贷款电话吗? 你的数据安全,真的得到过保护吗? 在这个大数据的时代,无论人们在哪里、在干什么,都会产生无数的数据,为了便于管理、复用,这些数据也会分别被存储到不同的地方,来帮助我们更便捷、高效地生活。 但正是由于各种数据的不断增长,传统的数据保护方式已经无法真正保护数据安全了。数据管理、数据隐私、甚至数据的所有权,都在面临着新的挑战——在中心化网络下的数据,依托于中心化的机构来管理,你真的能确定,你是数据的主人吗? 2018 年欧盟出台的《欧盟一般数据保护条例》(GDPR),2020 年 1 月 1 日,美国出台的 CCPA(California Consumer Privacy Act,加州消费者隐私法案)也面世了,加上近年来陆续出台的互联网隐私保护法等,最后都效果甚微。 连法律都难以制约,数字身份的隐私保护到底还能不能行了? 对于这个问题,王东临用实际行动为我们证明了:数据加密、存储及隐私保护不仅能行,而且还有很大的可发展空间。 说起王东临,大众可能不一定耳熟,但在IT 圈内可是个响当当的人物。15 岁被保送到南开大学计算机系,19 岁创业,曾获得“中国软件十大杰出青年第一名”、“中国软件业十大领军人物”、“中国电子信息产业标准化杰出人物”、“信息产业部科学技术进步奖、中国专利优秀奖、北京市发明奖奖等荣誉,还有截至目前共发明专利126件,其中海外专利(美国、欧洲、日本、国际)46件,中国专利80件……都足以说明他在科技领域的地位和贡献,以及他在技术领域的造诣是难以超越的。 而王东临本身也是一位创业老兵、“跨界狂人”,这些年来,可以说是紧跟着技术发展的脚步一路走过来的,从硅谷到国内,从软件、互联网、移动互联网、云计算到区块链,从电子印章、在线式DRM、电子书垂直搜索引擎、移动图书馆、安全通讯、“去TCP/IP”的分布式系统、分布式共享存储系统、加密去重技术、区块链存储等等领域都遍布了他的足迹。 尤其是在区块链储存方面,就不得不提王东临创始的YottaChain了,其拥有的两项专利技术“SurFS(分布式存储)”和“TruPrivacy(加密去重)”的优势得天独厚,被称为最专业的区块链存储公链。其中“TruPrivacy”在全球最大DefCon上经过公开验证,敞开服务器任出入,高额现金悬赏,无人攻破。它把加密和去重这两项看似矛盾的技术结合起来,在去重降低成本的同时又可以确保用户数据主权。 那么,对于区块链存储、数据安全方面,王东临到底做了哪些事情?与中心化数据存储相比,区块链上的去中心化存储有哪些优势,他又是如何利用这些优势的? 让我们跟随王东临的脚步,来看看这位「跨界狂人」的技术之路。 「跨界传奇」有感:在区块链行业里,跨界的人更能将事情做好 CSDN:请简单介绍一下您过往的经历。 王东临:我是一个「跨界」的人,技术、商业、治理都做出过一些成绩,经济学知道点皮毛,每个大界里还跨了很多小界。刚好区块链行业涉及技术创新、商业模式、经济模型和治理结构,跨界的人更能将事情做好。 我是计算机专业出身,从小对数学基础很感兴趣,例如研究希尔伯特的公理体系、罗素的逻辑学等。 我的研究功底可以追溯到年轻时读的罗素《数学原理》原著。它用了 100 多页定义了1和加法,之后的内容就相对简单了,有1和加法就有初等数学了,然后再构建高等数学,最难的就是最开头的基础。这种数学著作的内容有时候一页需要看一小时,我分了几个时间段才把这100多页读下来。后续我的很多成绩都与研究能力有关。正如下围棋最终是计算能力的比拼,做技术就是研究能力与逻辑能力的比拼。我对业内相关人士的建议也是一个:加强研究能力。 CSDN:您过去的业务都有哪些?是如何跨界的? 王东临: 我是学术功底,主要成就在工程界,跨了密码学应用、电子文档、存储等小界;创业20多年也算知名企业家,先后经历了软件、互联网、移动互联网、云计算和区块链时代,跨了toB和to C等小界,也跨了中国和美国等国界;做过立法、国际标准制定、参政议政等治理相关工作。主要业务有电子印章、电子书、云盘、分布式存储。 服务的客户包括了所有中央部委、所有银行、所有央企,尤其是一些国家顶级涉密机构要求非常严格,要求能够应付国家级对抗,说白了就是美国政府动用所有资源来攻击都能保证用户数据安全。所幸不辱使命,二十几年来有几十亿份涉密文件,从来没有出现过问题。 我们在存储上有全球顶级的“去TCP/IP” 分布式系统发明:分布式存储性能可以做到全世界性能最高、成本最低,排在世界第一。也进入过互联网行业,做了一个电子书网站,最初想靠全世界顶尖的数字版权保护技术和海量版权内容做起来,但第一关就当头一棒,朋友评价其更像软件而不是网站,当时也不知道从to B的软件公司跨到to C的互联网那么难,其实是九死一生的,我们是跨过去了之后才后怕的。但即便如此,那一年也是很痛苦的,没完没了地否定自己跨越鸿沟,最后学到一个经验:要根据数据来做决策。产品、公司战略都要根据运营数据调整,这是个不断调整和否定自己的过程。后来跟着数据调整成了电子书垂直搜索引擎,终于走通了,用了 1 年多时间从零做到了100万日活,在10年前这个数据也算说得过去了。 这些经历对我进入区块链行业也有很大帮助,因为互联网产品上的经验已经磨炼成专业水平了,所以我们如今 YottaChain和Ystar的用户体验在区块链行业就是非常顶级的了。 CSDN:那您是从什么时候开始接触区块链的?开始了解这个技术的? 王东临:接触区块链是 2012 年在美国硅谷的时候,了解比特币后觉得设计挺有意思,自己可以做有限改进但没有本质性提高而且不知道怎么推广,就没有作为一项业务来开展。 2018 年才算是真正进入区块链行业,在那年春节假期做了认真思考认为具备机会和条件了,但技术上和商业上有很多问题需要先花时间去思考路线,用了几个月时间基本想明白了,才组团队开始干。方向选的是区块链存储,因为有过去的很多基础和积累,可以做到最好。 CSDN:相当于区块链把您以前的经历都打通了对吗? 王东临:对的,密码学应用的技术,存储的技术,B端的商业能力(存储的用户是 B 端),C端的商业能力(大量Token用户是 C 端),你要懂得治理,要懂一些经济学,除了技术创新还要在工程实现上摔打过,各方面的能力经验都要有。正因为我过去这些都做过,而且还都做得不错,别人可没这条件,这也是我们现在做得比较好的原因。 数据是需要保护的,有“金刚钻”才能揽这份“瓷器活儿” CSDN:怎样的存储可以称为“好”?区块链的存储标准又是如何的? 王东临:无论是区块链存储还是中心化存储,最终比的还是存储服务。用户只会因为你的产品比人家好而使用,而不是因为你用了区块链技术而使用。 存储里最重要的一个指标叫做“数据持久性”(Durability),像桌面级是2个9,企业级一般是4个9到7个9,云存储大概11个9,到了区块链存储,我们至少是在 20个9以上来设计的。 在我这里做存储,先不讲技术,首先你要认为数据是有生命的,用户把数据托付我们,我们就要对数据的生命负责,这是最重要的。举个例子,开航空公司服务很差只是不爽,但飞行不安全一定不行。所以存储的第一指标就是:要对用户的数据负责,不能把它搞丢了。 从存储来说还有一个指标叫“服务可用性”(Availability),比如你的数据没有丢,但网站宕了,就是服务可用性出问题了。另外还有一个数据安全性指标,传统存储一般不包含,但区块链存储必须得有的,叫security,因为传统存储是中心化的,他靠边界安全来保护。但是对于区块链存储来说,节点分布在世界各地,每个节点都可能被人攻击甚至节点自身就作恶,所以不存在边界安全性,必须靠数据安全技术来保护。类似这样的指标有很多,列出来有十多个。 回过头来说,数据不丢、不被盗窃这两点都是至关重要的,但到目前为止,还是有一些做存储的企业把这两点当儿戏,拿区块链在业余玩存储,没有专业去做。 CSDN:那分布式存储相比中心化存储,最核心解决的问题是什么? 王东临:首先还是要说明下,「分布式存储」这个词本身是有歧义的。在区块链行业分布存储指的是去中心化存储,每个节点在不同的地域,是跨地域的分布式。而存储行业的分布式存储指的是同地域的分布式,分布式系统的每个节点都在同一个机房。 原理上来说,去中心化存储的可靠性要高很多。存储技术几十年来的发展路线就是不断地提高冗余和故障域隔离来提高数据可靠性,去中心化存储是存储行业发展的必然趋势。 冗余:桌面存储就是数据都存在一块盘中,可靠性不高,盘环了数据就丢了,而不管多么贵的盘本身可靠性是有瓶颈的;企业级需要更可靠的存储时,就要把数据以冗余方式保存到多个盘上,坏一个盘甚至更多盘,数据还能恢复,也就是做冗余。而到了云存储存,不仅做盘级别的冗余,还做了服务器级别的冗余。因为传统企业级存储如果服务器坏了,整个冗余组就全掉了,就需要跨服务器来做冗余才能进一步提高可靠性。 故障域隔离:故障域就是故障所影响的范围。举个例子,一个盘坏了,只影响这块盘上的数据,不影响其它盘,那就是说其故障域仅限这块盘。但如果是主板坏了,不仅影响所在服务器,还影响服务器上的所有盘,这些都是主板的故障域。桌面级存储是没有任何故障域隔离的,企业级存储是盘级别的故障域隔离,云存储是服务器级别的故障域隔离。 去中心化存储是跨地域的冗余,可以实现城市级别的故障域隔离,即使是几十个城市同时出现地震、原子弹攻击也不会丢失数据,所以可靠性要比桌面存储、企业级存储和云存储都高很多数量级。这是一种历史趋势,是产业发展的一个必然规律。 去中心化存储本身与区块链没有直接关系,但它的建设和运营需要区块链来做激励,多年产业实践证明需要 Token 激励才能够得到足够多的存储节点。 CSDN:我们知道,在去中心化存储领域,目前较为知名的项目有去中心化存储系统IPFS以及存储公链Filecoin,与之相比YottaChain在技术上有怎样的不同和优势? 王东临:在区块链存储行业中,IPFS是最知名的去中心化存储系统,FileCoin是最知名的存储公链,是区块链存储的旗手和标杆。从区块链激励构建去中心化存储系统来说,Filecoin和YottaChain是相同的。但从去中心化存储系统本身的工程实现来说,YottaChain由于团队深耕存储领域多年,所以要更专业一些。 YottaChain同样具备Filecoin开创的数字货币有商品属性和共享资源挖矿的良性模式这两大优势,并在存储专业性、商用价值和工程实现上更有优势。YottaChain将去中心化存储对中心化存储的理论优势都完整实现了,成为一个今天大家可以看得见、摸得着的系统。我们在数据安全性上也有明显的优势,可以完美保证用户的数据隐私。这就是为什么说YottaChain是第一个可商用的存储公链的原因。 在数据可靠性保障机制上,IPFS/Filecoin并不完整,它对热数据相对有保障,但冷数据还是会丢。而实际上,冷数据是占90%以上比例的。而且在我们存储专业人员看来,数据是有生命的,处理数据的权力只有用户自己,存储人没有权力去替用户判断什么数据可以不好好保管。用户把数据托付给你,你就该给用户保存好。就像客户存钱到银行,银行可以因为存单时间太久,而且钱不多了,就当客户没有这笔钱了吗?这显然是不符合行业职业道德的。这方面YottaChain就会相对专业一点,有完善的数据可靠性保障机制,数据冗余、故障域隔离、心跳监测、数据重建等关键环节都齐全,可以保证数据不丢。 IPFS/Filecoin没有设计数据持久性保障机制,和IPFS不对数据加密有直接关系。据伦理要求,IPFS/Filecoin不能把数据自动推送到其它节点,以避免将色情图片推送给女性,或者将宗教禁忌内容推送给不合适的人。如果是加密数据,都是看不出内容的随机数一般的密文,就不存在这个问题,但对明文数据就必须考虑这个问题。IPFS/Filecoin不加密,与其没有密文去重技术有直接关系。没有这项技术,IPFS/Filecoin只能在加密和去重之间二选一。如果选择了数据去重,牺牲了数据加密,就导致了IPFS/Filecoin的数据持久性保障机制的缺失。 IPFS/Filecoin不加密,还直接导致了数据安全性保障机制的缺失。上传到IPFS/Filecoin的数据对任何人都是开放的,只要知道Hash值就可以读取。如果说BAT这样的中心化平台会偷用户数据作恶的话,那也只是一个人偷,而将数据存储到IPFS/Filecoin这样的没有数据安全性保障机制的去中心化存储系统,就变成了人人都可以偷数据。毕竟,将数据不被偷的希望寄托在没人知道该数据的Hash值,就相当于将隐私数据放到一个公开的网站上,赌没有人知道该网站的域名。 YottaChain有完备的数据安全性体系,可以做到商业意义和工程意义上数据的绝对安全。同时我们有独家密文去重技术,使得在不影响数据安全性和伦理性的前提下,可以通过数据去重大幅度降低存储成本。 CSDN:具体来说,YottaChain是如何解决上述问题的? 王东临:YottaChain拥有完备的数据可靠性保障机制,能对数据持久性、服务可用性、数据一致性、容灾性都起到强有力的保障,而且数据冗余率极低。 我们将每个存储数据块编码成N+36(N<=128)个数据分片,128+36的LRC编码相当于数十个副本的冗余效果。每个数据分片保存在不同地域的不同服务器上,这样每个数据块最多将保存在164台服务器中,可容忍最多36个地域同时出现断网宕机等故障或灾难都仍然能保证服务可用性,比IT巨头的服务可用性也是提高很多个数量级,当然这是我们预想的最坏结果,实际上系统的心跳监测会迅速发现故障继而进行数据重建。只有在第一个存储节点故障后、完成数据重建前,同数据块还有几十个存储接电线也同时出现故障,才会丢失数据,仅计算硬盘故障因素的话,比IT巨头的持久性高64个数量级(1亿亿亿亿亿亿亿亿倍)。 YottaChain的数据安全体系,实现了全程加密、无缝加密、零知识加密,并有专业的密钥管理系统,和密文去重技术,这意味用户端以外永远不出现数据明文或密钥明文,所有超级节点和存储节点联手作恶也计算不出数据明文,一文一密,上万亿不同类型密钥环环相扣。除了用户自己,谁也解不开存储的数据。 风口起来了,专业要跟上 CSDN:现在有没有比较大的应用场景? 王东临:传统存储的技术接口有块存储、NAS存储和对象存储三种,我们已经完全兼容对象存储接口,AWS、阿里云的用户可以直接无缝迁移到YottaChain。粗略估算,对象存储的开发者恐怕就有几十万,这都是我们现成的社区。我们今年还将提供NAS存储,可以对接更多的用户,那就是数以百万计了。 在商业化应用场景方面,我们的优势在于持久化存储和第二存储,后者主要是容灾备份为代表。第二存储本身就是存储行业的一个风口,很多家第二存储的公司都拿到了比Filecoin更多的融资。 目前,YottaChain处于小规模商用阶段,用户数量不多,只有几百个。至于节点数量,我们已经拥有了3000多个存储节点,包括126个超级节点。目前,我们已经和很多大型存储用户、存储相关的产品和服务供应商都达成了明确的意向。只要能顺利通过他们的试用,后期就比较乐观。当然,我们也有一些补贴和奖励政策,现在就像滴滴刚起步的时候那样,我们对矿工和用户是双向补贴。等技术品牌、口碑建立起来了,就可以逐渐减少补贴,直到完全正常运转。 当前阶段,我们的重心就是打磨产品,让产品更成熟(也就是说要经得起折腾),在市场上建立口碑,下一阶段则是拿早期的案例大规模推广。另外,我们也会做全球市场,除了东南亚、中东,今年也会进军美国、欧洲。 CSDN:有相关的数据可以分享一下吗? 王东临:我们的主网——存储网于去年12月24日上线的,今年1 月10日完成激活,目前日存储量已经达到40TB,总存储量于4月8日超过了上线6年的老牌区块链存储项目Sia,成为全球存储容量最大的存储公链;于4月16日突破1PB。如果你对40TB是多少没有概念的话,可以这么理解:YottaChain一天存储的数据量,就相当于BTC 1000年的总和(注:BTC只有交易数据,所以数据量小)。 CSDN:孟岩老师也提到过,区块链首先要结合的一个技术不是大数据而是存储。但大部分人还不是很理解为何要用这种存储?如果这是一个发展的必然,我们要注重的是“区块链+存储”还是“存储去中心化”? 王东临:我始终认为,存储无疑是区块链商业落地的最佳应用场景。一是存储自身有去中心化需求;二是用户越多,去重的放大效应越高;三是区块链激励存储节点加入,能够更好地激励用户使用;四是存储数字形式存在的实体经济,可以无需任何中介直接上链。总之,在数百亿美元的持久化存储和网络加速领域有压倒性优势。 我们为什么需要去中心化存储?因为纵观存储技术的发展历史,一直都是沿着“不断提高冗余和故障域隔离提高可靠性”的技术路线发展,从桌面级存储的无冗余发展到企业级存储的硬盘级冗余,再发展到云存储的服务器级冗余,再进一步发展到跨地域冗余的区块链存储是存储技术发展的必然趋势,在大数据来临时可以满足人们对于数据存储容量和数据持久性的更高要求,不受诸如停电、断网、雷电、地震、火灾、运维失误、人为破坏等风险影响。 “区块链+存储”和“存储去中心化”其实并不矛盾,你可以这么理解:通过“区块链+存储”实现了“存储去中心化”。 CSDN:您怎么看待 2019 年去中心化存储的发展,以及对2020有什么预期? 王东临:2019年可以说是区块链价值的元年,也是区块链存储的风口启动的一年,但是专业、专注的项目还是凤毛麟角。因为区块链存储首先是个存储系统,还涉及数据主权问题,只有在存储技术和数据安全技术上都有深厚功力才能做好,甚至是做出可以超越现有中心化存储巨头AWS、Google这样的项目。 经过2019年的历练,像YottaChain这样的区块链存储项目已经成长起来,在2020年将走向成熟阶段,承担起数据存储的重担,突破行业瓶颈,提供更安全、更可靠、更低成本的存储服务,为数字经济基础设施工作贡献力量,实践区块链真正的商业价值。 本文来源:YottaChain —- 编译者/作者:YottaChain 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
【CSDN专访】YottaChain创始人王东临:用科学家的精神做企业
2020-05-06 YottaChain 来源:火星财经
LOADING...
相关阅读:
- 波卡周报 | DOT 转账功能将于下周二进入执行阶段2020-08-03
- 区块链游戏文摘7月27日至8月2日2020-08-02
- 辉神解币:8.2比特币趋势分析2020-08-02
- 区块链上的鲜血:令牌化可以使捐赠更有效2020-08-02
- ?zgürDemirta?的以太坊预测是正确的2020-08-02