抚州云动洛希云|分布式文件系统与分布式对象存储系统有何差异?

原创
1368 天前
2549

在分布式存储领域,还有分布式文件系统与分布式对象存储系统之说,那么,这二者分别是什么,有何不同之处呢?

 

分布式文件系统的起源是Google于2003年发表的一篇论文《The Google File System》,其核心目标是设计一款具有高扩展能力和容错能力的高性能文件系统。简单来说,就是基于一个单一并行文件系统组合多个存储节点为存储集群,为多个客户端的并发高带宽数据访问提供单一命名空间存储池。数据分散存储到集群中的多个节点上,基于数据自愈技术为客户端应用提供高可靠和高可用的数据服务,并可实现性能和容量的线性扩展。

 

分布式文件系统具有高性能、易扩展、高可用性、高性价比、开放兼容性等显著特性。

 

而分布式对象存储系统,是以对象结构来存储数据的存储系统,前端服务器客户端通过协议(例如HTTP)或者API接口(例如S3、Swift)进行访问。从概念上来说,对象与文件一样,都包括内容和元数据。与文件相比,对象通常支持更丰富的元数据,用户或应用可为对象设置用于管理、数据挖掘和数据迁移的元数据属性。

 

二者之间具体的差异表现为:

1、支持的存储访问协议不同

分布式对象采用更加专用的协议(比如HTTP)或者API接口(例如S3或是Swift)进行访问,相比通用的NAS文件协议,需要前端应用做针对性的适配和接口定制开发。

 

2、支持的数据读写模式不同

与文件系统不同,分布式对象不支持数据的随机读取和写入,仅可针对整个文件做put或是get操作,这种模式基本把分布式对象限定在有限的数据写入后,有限的读取、极少修改的应用场景,例如互联网的云盘、备份归档以及法规遵从等温冷数据应用场景。

 

3、数据结构不同

文件采用树形目录结构,可以满足应用多级目录嵌套使用模式,但是随着嵌套层次和文件数量的增加,读取和存储数据时需要更长访问路径,当访问的文件过小时,单个文件访问性能受影响较大。

 

对象采用扁平目录结构,不支持多层嵌套的数据组织结构,只保留二级或是三级目录结构,只需要一个ID就能直接获取对象,这种数据结构在千亿级别海量小文件应用场景中会体现出一定的性能优势。

 

综上分析,基于应用当前需求和特点,Filecoin的存储系统更适合采用成熟的分布式文件系统构建。另外,同时支持文件、对象、块协议的分布式统一存储将成为发展趋势,也为去中心化存储未来的多模式应用提供了技术可行性。

 

洛希云,全球领先的Filecoin服务商

抚州云动网络科技有限公司