作为按对象/块/文件方式存储的开源分布式文件系统,Ceph程序代码人人皆可得,但想要易于部署与管理,功能、效能、稳定性样样精通,达到企业级的存储系统需求,就要各凭本事了。让我们来看看新兴与传统存储厂商如何以Ceph开创新格局:
在OpenStack环境当中,应用相当普及的Ceph存储系统,本身也是开源软件,采用的是LGL2.1授权模式,允许开发者与一般公司使用,并且也能将Ceph整合到他们发展的软件上,不需要配合Copyleft授权而释出自己开发的程序原始码,这就意味着即使是专属软件,也能自由运用Ceph。
此外,由于Ceph基于本身的分布式存储集群环境,可同时提供对象存储、区块存储、档案层级的存取,可应用的场景相当多元,因此也吸引各式各样的人来采用──不论你是只需要当中的特定一种存储环境,还是同时需要多种存储环境,Ceph都能满足。
而且这样能自由运用的特性,除了对希望节约成本、取得更多软件应用主导权的用户有利,对于有心发展存储应用产品的厂商,Ceph也一视同仁。
开源软件崛起 Ceph 为初创公司打开新的市场切入点
大多传统存储厂商为了更彻底地保护自身利益,对其所开发的产品大多采用的都是封闭授权的模式。毕竟好东西当然留给自己人用,肥水怎能落入外人田?然而,在各式开源软件应用大行其道的今天,产品的采用率要够高、抢得市场先机,接下来才能再去想怎么获益。
而且,传统存储厂商在产品的开发模式较为封闭,自身需投入很多时间、人力,把软件做到尽善尽美之后,再想办法卖出去,等着用户捧着大把钞票上门购买。相较之下,基于开源模式所发展的存储软件,则不是如此,产品设计过程较为透明,并且会与开发者与使用者社群充分互动,再推出符合大家需要的产品,但这种作法相对也有不少代价,例如,因为牵涉到很多人的意见,并无法确保软件开发期间的效率,时间会耗费得更多,而完成到一定程度之后所发表的成果,也未必经过好好的调校,而达到最佳的执行状态。
但也因为这些看似缺点的不确定特性,也让更多能善用的初创IT公司能够发展起来,或是让原先无法进入这个领域的企业,获得入场角逐的资格,所以,在如此态势之下,开源模式并非商业应用的威胁,反而是人人都能够好好把握的机会,因为你可以基于集群先前所开发的成果,继续强化、改良,然后可以依据不同授权的要求,选择将这些程序代码回馈到社区,或是进一步推出自有品牌的产品,即可快速抢市,却不需要重新造轮,等于站在巨人的肩膀上成长,却不会被特定厂商所捆绑。
在Ceph身上,也体现了这些特性,甚至因为开源如今席卷全世界的风潮,带来更多的应用可能性,除了云服务业者和企业自行以此建置高扩充性的存储环境,更有一些新兴存储厂商基于Ceph软件技术的基础,来发展自有品牌的产品,或是用它来扩充既有产品的不足之处。而且,这样的合作让厂商引以为豪,不再刻意隐瞒,我们可以很清楚地知道,这些产品的技术源头是Ceph,或仅用其中一部分。过去,这么做的厂商其实很多,但往往讳莫如深,彷佛是不能揭露的秘密,一曝光就会失去竞争优势,或失去用户信任。
而现在,愿意公开自身产品是基于Ceph技术所发展出来的厂商,其实越来越多,一方面可能是因为Ceph的多重功能与号称可无限延展的特色,受到很多用户的肯定,一方面也是因为Ceph软件本身仍有不少可扩充、调校的部分,也突显了投入加值开发的必要性。
就目前我们所知道的,基于或部分采用Ceph技术开发的商用存储系统,主要有几家厂商的产品,像是Bigtera、Hope Bay,SanDisk的InfiniFlash系列全闪存存储阵列,也在其中一款机型用了Ceph。
另外,我们也找到一些厂商产品强调采用Ceph,像是Scalable Informatics的Unison系列、storageFOUNDRY的Nautilus系列等等。
Hope Bay:看中 Ceph 统一存储特性 强化服务器可用性与监控力
我们联系到第一家采用Ceph技术的,是近年来颇富盛名的Hope Bay科技。其目前拥有ArkEase Pro云端存储服务平台、ArkFlex云端大规模数据存储平台、Ark Express云端存储网关、ArkVoice企业云端语音录制平台。
其中,ArkFlex所导入的磁盘群组机制,即与Ceph有关,藉此让使用者获得较大的可用空间,并兼具服务器节点的容错能力,以系统默认的6+2的丛集节点运作模式,实际可用空间能达到75%,而最多能容忍同时故障的服务器是2台。
而且,对于Hope Bay验证过的硬设备,这套系统也支持相关的监控功能,可持续监督服务器系统硬件。
若以既有的Ceph功能来说,在同样的集群规模下,用户能获得的可用存储空间,无法达到这么高的比例,而且,其可用性主要还是针对数据的保护,虽能提供3个副本的保障,但对于服务器端的可用性与监控机制,功能仍较为有限。
至于Ceph对于文件系统支持较为有限的缺憾,ArkFlex也对此进行改良,使其支持CIFS、NFS、iSCSI,让传统应用程序若要以这些方式存取存储系统时,也能与其相互搭配使用。因此在设计上,Hope Bay是将CIFS、NFS、iSCSI建构在Ceph RBD之上,并自行设计实作提供了容错的功能。
另外,在效能强化的部分,Hope Bay也提供两种SSD加速机制,可因应IOPS需求较高的应用系统类型。而在丛集环境的部署上,这套存储系统最少需要4台服务器来支应,但他们会建议使用者能一次建立8台为1组的储存池。
当初会用Ceph,Hope Bay科技技术总监表示,他们想寻找能作为云端存储后台的解决方案,需支持对象储存,又要能横向扩展规模到很大的程度,早期,Hope Bay曾用Swift,它的确是一个选择,但由于Swift只能做到对象式储存,而Ceph应用方式更为广泛,可同时支持档案式、区块式、对象式等各种存储接口,是全方位、统一(Unified)设计的存储产品,因此Hope Bay后来决定采用Ceph。
▲Hope Bay ArkFlex强化监控Ceph主机功能
Hope Bay在旗下的ArkFlex存储系统当中,采用了Ceph技术,同时也增强一些保护机制,例如这套系统可监控系统的硬件状态与硬盘相关参数。(图片来源/Hope Bay)
SanDisk(闪迪):借力 Ceph 实现同时提供块存储与对象存储
去年SanDisk并购Fusion-io之后,今年1月推出混合式存储阵列——ioControl,并将相关业务转移、成立新的公司NextGen。而SanDisk自己在3月推出新的全闪存阵列InfiniFlash系列,最大可提供512TB的存储空间,可达到78万IOPS与7GB/s的吞吐量,而当中就有一款机型IF500采用Ceph技术,并因此能同时提供对象存储与块存储。
SanDisk在此之所以采用Ceph,主要是为了突显他们支持开源与开放标准的立场,因为该公司也是Linux基金会与OpenStack基金会的成员,也经常贡献程序代码给Ceph的软件与社区,于是,他们会希望将这些技术用于闪存存储的领域,做到让人能够信服的地步,并且持续提供更多样化的功能,例如具有QoS、提供较易用的操作方式,以及改良效能,使软件与固态存储之间的存取效率增加,设法让Ceph做到闪存存储应用优化,增加耐用度。
他们也提供以政策来管控存储资源的方法,用户能针对系统中的不同全闪存存储装置,来做到分层存储管理,以及自动化作业。同时,SanDisk开发了新的REST API、命令行接口、图形化的用户接口,以便管理底层的存储硬件资源。之后,SanDisk也会把Ceph异动的部分回馈给社群,以便能够利益大众。
至于支持OpenStack的部分,由于SanDisk InfiniFlash用了Ceph,因此与OpenStack兼容性没问题。除此之外,能否与OpenStack的Cinder、Swift等组件之间妥善搭配,也是他们所致力的主要目标之一。
值得注意的是,IF500是SanDisk在InfiniFlash系列定位中端的机型,至于其他两款产品,所用的存储应用系统软件也各自不同。
目前最低阶的IF100整合了Nexenta的NexentaStor,存储容量可扩展到2PB,这是因为该系统是基于ZFS文件系统技术,具有弹性增长规模(Resilient Scale-up)、整合式块存储(FC与iSCSI)与档案式存储(NFS、SMB)。而最高阶的IF700,用的则是SanDisk ION Accelerator,这套软件源自Fusion-io时期,去年曾推出整合式设备ION Accelerator Appliance,而现在整合到InfiniFlash系列的架构下,主攻高效能需求的块存储应用。
由此可知,Ceph虽然够独特,优点很多,但基于不同的产品考虑,想要采用或搭配的存储厂商,也未必会全部把宝押在它身上。
▲SanDisk新款快闪储存数组用Ceph
InfiniFlash系列是SanDisk今年新推出的全快闪储存数组,当中的IF500里面就以Ceph作为主要储存应用系统,因此这台设备可同时支持对象储存与区块储存,可扩展的储存空间规模能到2PB以上。(图片来源/SanDisk)
“泛”Ceph 产品层出不穷 竞争愈发激烈
除了这些基于Ceph技术的产品,Nexenta今年也开始狂打开放牌,强调他们旗下的产品NexentaStor、NexentaConnect、NexentaEdge,皆是开放式的软件定义储存方案(OpenSDS),Supermicro、Dell等服务器厂商陆续与Nexenta合作,推出整合方案,而在存储厂商方面,搭配Nexenta软件的产品也开始出现了,上述SanDisk的IF100即是一例。
为不让Ceph和Nexenta专美于前,有些软件定义存储产品,则企图拉拢服务器厂商,例如EMC的ScaleIO就找上云达科技(QCT),推出整合服务器的应用方案。
今年有些新推出的存储系统,似乎也具有不少与Ceph共通或相似的特质,但我们不太确定是否与Ceph有渊源。例如,乔鼎今年3月推出的VSky A系列横向扩展储存设备,在该公司网站发布的消息提到,它可针对对象、档案及块等存储环境,提供横向扩充能力,在单一平台可扩充至PB等级的空间,并能透过单一管理接口操作数据保护,以及对象、NAS、iSCSI SAN等存储功能。
另一款产品和Ceph的功能相差就比较大了,但也值得留意。例如HGST并购Amplidata后推出的Active Archive System,单柜已提供4.7 PB的对象存储空间,并且可无限制扩展规模,数据可用性据说能到15个9(99.9999999999999%),而Ceph的资料可用性是9个9(99.9999999%),相较之下,似乎矮了一截。因此,这套方案也是不容忽视的大数据存储产品。