虽然大量的数据每天都在产生,但在许多领域依然存在数据有限并且质量低下的情况,在跨领域数据方面情况更严重,不同行业的数据源之间也存在壁垒,每一类数据往往都储存在于同一领域的企业或组织中。 一般来说,大多数行业里,数据之间都是相互独立,也就是以数据孤岛的形式存在,甚至在某个企业内部,由于竞争、隐私或者合规方面等原因,不同部门之间实现数据共享都会非常难。因此如果想要在现实环境中将分散的数据进行整合和共享,其基本上是很难的,花费的代价也很大。另一方面,随着大数据的进一步发展,重视数据隐私和安全已经成为了世界性的趋势,其也在对传统的数据共享手段提出新的挑战。 因此,需要寻找新的解决方案来将数据整合,并解决一系列的利益问题,使得数据能在不同行或者同行业不同部门之间流动起来,同时让所有人能享受数据共享带来的利益。 联邦学习(Federated Learning)最早是由谷歌在2016年提出,但它最早并不是专门用于人工智能中,原本是用于解决安卓手机终端用户在本地更新模型的问题,使得在数据交换的时候也能保证信息安全和个人隐私,并在保证合规和安全的情况下,使得不同机器和来自多个不同节点的计算能力相结合,从而积少成多,大规模整合算力,并开展高效率的机器学习。联邦学习可使用的机器学习算法不局限于神经网络,还包括随机森林等重要算法。 举例来说,如果两个公司希望共享数据联合训练一个机器学习模型,不过他们系统之间的业务系统分别拥有各自用户的相关数据。考虑道数据隐私保护和安全,两家公司并不能直接进行数据交换,可使用联邦学习系统建立模型。 联邦学习主要由加密数据对比、模型训练和激励三部分来组成。 加密数据对比 其主要是防止一些诱导性的训练方式,会优先对比双方是否由共同的用户,在保密的状态下就把重复的部分排除在外,避免信息的泄露。 模型训练 为了保证训练过程中数据的保密性,一般需要第三方协作者胡总和第三方硬件进行加密训练。协作者会将公钥分发给数据提供者,用于数据加密,而数据提供者将进行交互,分别基于加密的情况下进行计算,并且把结果返回给协作者。协作者将加密的部分进行解密,并将结果分发回数据提供者,并完成一次训练。当然,协作者可以是其他形式,例如双方的SGX硬件可以进行交互,来形成可信计算集群进行安全的数据学习。 激励 联邦学习能解决不同机构之间的参与度问题,也就是说实际应用后的模型效果会记录在区块链等功能上,并形成激励机制。比如提供更好的数据的机构能获得更好的激励反馈,同时激励更多的数据和算力加入进来。冲量网络也将利用区块链技术,将联邦学习的过程透明化和市场化。 数据隔离 外部不会泄露给任何非权限拥有者,满足用户隐私保护和数据安全的需求。 效率高 联邦学习能保证模型质量不会出现损坏,其会降低负作用的情况,保证联邦模型比割裂的独立模型效果好。 公平 所有参与进来的人都是公平且能分享激励的,使得整个合作的过程都处于公平的状态。 独立 保证参与各方在保持独立性的情况下,进行信息与模型参数的加密交换,并同时获得成长。 联邦学习分为横向联邦学习、纵向联邦学习与联邦迁移学习。 横向联邦学习主要用于用户数据重叠比较多但用户重叠比较少的情况,取出双方用户特征相同而用户不完全相同的那部分数据进行训练。一般用于同业公司中,例如银行与银行间。 纵向联邦学习一般用于用户数据重叠较低但用户重叠较多的情况,取出双方用户相同而用户特征不完全相同的那部分数据进行训练。一般用于非同业关联公司中,例如征信机构与电商的合作。 联邦迁移学习则是用于用户和数据重叠都较少的情况下,不对数据进行切分。例如两家非同业甚至是非同地的企业,来解决单边数据规模小和标签样本少的问题,从而提升模型的效果。 联邦学习的产生为人工智能打破数据屏障和进一步发展提供了新的思路。在未来,联邦学习会在可信协作、人工智能中发挥更大的作用使得跨机构可信数据协作的效率变得更高,简化数据计算中的复杂算法,减少参与者之间的互信成本。 冲量网络也将利用联邦学习技术来建设可信协作平台,帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行机器学习建模。利用SGX技术使得数据不出库便能进行联合建模,并自动根据数据特征选择相关的方案,进一步优化可信协作平台的体验,保证大规模可信算力能有用武之地。 -------------------------------------------------------------------------------------------------------------------------------------------- 冲量网络隶属于上海冲量网络科技有限公司,致力于打造全球区块链可信计算网络,为商业场景提供可信计算、安全存储和区块链网络解决方案和PaaS服务。冲量网络通过汇聚多样化的可信计算资源建立全球最大的可信算力网络,支持企业、政务大数据中心的数据联合计算、联合建模、区块链外可信存储、可信供应链金融、可信跨链服务等场景的分布式计算。同时,冲量网络为企业提供一系列的基于区块链+X技术的产品和解决方案,打造下一代的分布式可信计算平台,支持区块链的边界无限扩展,是Web3.0时代的重要基础设施。 详见:www.impulse.top 本文来源:冲量网络 —- 编译者/作者:冲量网络 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
冲量网络 | 联邦学习
2020-04-14 冲量网络 来源:火星财经
LOADING...
相关阅读:
- 冲量网络|泛谈密码学2020-07-21
- 冲量网络|可信计算与数字签名2020-06-29
- AI不仅要智能,更需要人文:联邦学习重构大数据风控范式2020-06-22
- 冲量网络 | 隐私保护:可信社会基石2020-06-15
- 可信数字联盟在商旅供应商场景中的应用探讨2020-06-09