分布式存储有多种类型,如分布式块存储、分布式文件存储和对象存储等。不同的形式,适用于不同的业务场景。
超融合中也包括分布式存储,它和其它分布式文件/对象存储有什么区别?它能够做为PACS影像存储吗?很多用户都有这个疑问,本文将回答这个问题。
超融合架构
首先从定义来看:超融合基础架构(hyper-converged infrastructure,简称HCI)是一个基于软件定义的 IT 基础架构。HCI运行在标准X86服务器之上,功能组件包含:虚拟化计算(hypervisor),分布式存储(SDS:软件定义存储)和虚拟网络。
超融合文件存储的实现方式
超融合平台实现的是分布式块存储,主要功能是给虚拟机提供云硬盘,作为操作系统安装盘或数据盘。当HCI平台创建很多个虚拟机时,就需要创建很多个云硬盘。每个云硬盘的存储空间分布在多个X86服务器的所有硬盘上,因此单个云硬盘具有高于传统RAID阵列的性能。
如果要基于超融合平台对外提供文件服务,常用的方法是:
(1)创建一个大容量的云硬盘;
(2)将云硬盘挂载到一个虚拟机;
(3)在这个虚拟机上启动文件服务,作为NAS网关,对外提供服务。
超融合文件存储的挑战
可以看到,这种方式中存储空间是分布式的,但数据管理是集中式的,NAS网关是单点性能瓶颈。这种架构管理少量的数据是可以的,比如数据量不超过10TB,文件数量在百万级,但无法管理更大规模的PACS系统海量文件;其性能、可靠性也存在风险。
另外,从产品的定位看,超融合要兼顾计算和存储,每个节点中配置的CPU和内存比较高,但磁盘数量比较少;而海量数据存储需要更多的硬盘数量,但对CPU和内存要求比较低,因此将超融合用于海量数据存储也是不经济的。
分布式文件/对象存储的优势
专用于海量数据管理场景的分布式文件/对象存储,其系统架构和超融合中的分布式存储是不同的。
以碧海分布式存储系统为例,其系统设计就是面向海量数据管理的场景,所有的文件数据和元数据管理都是分布式的,均衡分布在所有的x86服务器上,因此不存在单点性能瓶颈,性能更好,可扩展性和可靠性更高;可管理的数据量可达到PB级以上,可管理文件数量达到百亿级以上。
各取所长,相得益彰
综合医院在信息化建设中的宝贵经验,我们梳理出如下建议:
核心数据库业务和应用,使用刀片服务器+FC SAN存储的组合,系统更稳定、安全、可靠;
非核心应用系统,如Web门户网站和OA办公系统等,部署在超融合平台,可快速部署、易于管理、易扩展、轻运维等;
海量非结构化数据,如PACS影像数据等,选择碧海存储等分布式存储系统,具有高性能、易扩展、可靠性高等优点。