在分布式存储领域,还有分布式文件系统与分布式对象存储系统之说,那么,这二者分别是什么,有何不同之处呢? 分布式文件系统的起源是Google于2003年发表的一篇论文《The Google File System》,其核心目标是设计一款具有高扩展能力和容错能力的高性能文件系统。简单来说,就是基于一个单一并行文件系统组合多个存储节点为存储集群,为多个客户端的并发高带宽数据访问提供单一命名空间存储池。数据分散存储到集群中的多个节点上,基于数据自愈技术为客户端应用提供高可靠和高可用的数据服务,并可实现性能和容量的线性扩展。 分布式文件系统具有高性能、易扩展、高可用性、高性价比、开放兼容性等显著特性。 而分布式对象存储系统,是以对象结构来存储数据的存储系统,前端服务器客户端通过协议(例如HTTP)或者API接口(例如S3、Swift)进行访问。从概念上来说,对象与文件一样,都包括内容和元数据。与文件相比,对象通常支持更丰富的元数据,用户或应用可为对象设置用于管理、数据挖掘和数据迁移的元数据属性。 二者之间具体的差异表现为: 1、支持的存储访问协议不同 分布式对象采用更加专用的协议(比如HTTP)或者API接口(例如S3或是Swift)进行访问,相比通用的NAS文件协议,需要前端应用做针对性的适配和接口定制开发。 2、支持的数据读写模式不同 与文件系统不同,分布式对象不支持数据的随机读取和写入,仅可针对整个文件做put或是get操作,这种模式基本把分布式对象限定在有限的数据写入后,有限的读取、极少修改的应用场景,例如互联网的云盘、备份归档以及法规遵从等温冷数据应用场景。 3、数据结构不同 文件采用树形目录结构,可以满足应用多级目录嵌套使用模式,但是随着嵌套层次和文件数量的增加,读取和存储数据时需要更长访问路径,当访问的文件过小时,单个文件访问性能受影响较大。 对象采用扁平目录结构,不支持多层嵌套的数据组织结构,只保留二级或是三级目录结构,只需要一个ID就能直接获取对象,这种数据结构在千亿级别海量小文件应用场景中会体现出一定的性能优势。 —- 编译者/作者:洛希云 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
抚州云动洛希云|分布式文件系统与分布式对象存储系统有何差异?
2021-04-15 洛希云 来源:区块链网络
LOADING...
相关阅读:
- 以太坊可能在5月底达到5,000美元–链上数据显示2021-04-15
- 以太坊的发行机制及数据它的挖矿原理是什么?2021-04-15
- Solana的数据聚合器Step Finance私下融资200万美元2021-04-15
- 2021做火的挖矿项目:IPFS是小本赚钱的商机!2021-04-15
- 跨链技术解决区块链数据孤岛成为刚需,WEBT公链对接链上资产交易和数据2021-04-14