当NVMe在10年前以硬盘接口协议的身份出现时,谁也不会料想到,它会在基础设施领域,获得今天的荣光。当时,存储介质从机械硬盘(HDD)发展到了高性能的固态闪存(SDD),但与此同时,为传统机械硬盘而设计开发的SATA或SAS协议,开始限制固态盘的性能。
随着CPU、DRAM和网络速度的提高,NVMe协议被创建了出来。之后,人们也才开始考虑将NVMe发展到存储网络领域,进一步释放存储与计算之外的性能潜力——在二者之间建造一条高速公路。现在,华为建造的这条高速路车水马龙。全球一系列典型用户陆续选择华为全闪存作为企业数字化转型的基础设施支撑,其中就包括如瑞士第二大医疗保险公司CSS保险、瑞典最大的通信运营商瑞典和记、国内最大的新能源汽车制造商比亚迪、顶级三甲医院协和医院、顶级券商中泰证券等。2019年底,IDC发布的报告显示,第三季度全球企业外部OEM存储系统支出同比增长1.3%,其中,华为存储取得了49.6%的增幅。它既是市场的领跑者,也是华为存储业务的领跑者——内部增速最快的产品线。在Gartner发布的《2019主存储魔力四象限》报告时,华为凭借出色表现,被定义为主存储领导者厂商。如此高速精进的背后,是华为存储十余年的积累。2018年底,华为宣布其OceanStor Dorado V3系列全闪存存储率先实现了全系列支持NVMe架构,成为业界唯一全系列支持NVMe架构的全闪存存储。之后,OceanStor Dorado V6全闪存存储,还达到了业界最快极致时延——小于0.08ms。截至目前,华为还是业内唯一端到端开发了NVMe SSD盘、NVMe闪存控制器和NVMe全闪存操作系统的厂商。成就源于对方向的执着和对技术创新的持续投入。早在15年前的2005年,华为就已经开始了对闪存技术的研究投入。相关数据显示,在传统存储巨头林立的ICT市场,今天的华为已经是存储行业拥有SSD盘片级专利最多的厂商之一。今年夏天,入选华为“天才少年”项目的两位博士生,分别以201万元和156万元年薪入职后的研究方向,正是存储领域。如果纵观这一漫长的创新进程,“天才少年”——它代表了对技术创新能力的极致追求——本就是华为全闪存的应有之意。但在存储业务中,华为何以会对NVMe如此“高看一眼”?除了华为在人才战略中的传统认知可以解释外;IT调研与咨询服务公司Gartner的一份市场预测数据,也从一个侧面给出了答案。
据Gartner预测,2022年,NVMe SSD在存储中占比将达到52%,而在眼下的2020年,这一份额仅为27%——这是一个在2年中即将翻番的市场。在这一点上,华为是“幸运”的——如今,华为NVMe全闪存阵列的性能优势已十分明显。以华为NVMe全闪存支持端到端NVMe这一点为例,由于CPU和NVMe SSD可以直接通信,华为实现了让传输路径更短,传输效率更高,传输延迟更少等价值亮点。
同类厂商SAS全闪存与华为NVMe全闪存传输路径对比
具体而言,它将存储时延大幅降低——极致时延小于0.08ms;由于采用1套IP系统管理整个数据中心,华为NVMe全闪存还极大简化了数据中心内的部署,并节省了维护成本。同一原因引发的优势远不止于此,因为支持端到端NVMe这一优势,它让用户业务在处理写请求的效率比SAS全闪存高出了1倍;因为协议栈更加精简,用户可以减少50%等协议封装开销,从而节省每一次协议封装导致的CPU资源消耗,并缩短IO传输延迟等。此外,在多队列并发、锁机制优化,以及操作系统优化等层面,华为NVMe全闪存都建立了相应的性能优势。尽管存储协议向更高效的NVMe协议发展已经必然——正如Gartner预测的那样;但作为一种全新的协议,它在为用户带来极致性能的同时,仍给盘片和系统的设计带来新的挑战。这些挑战目前集中在4个方面。首先,企业存储领域通常采用双控冗余技术保障系统高可靠,但是基于PCIe的双端口技术是SSD设计面临的一个难题。作为应对,华为通过自研SSD支持双端口技术,两个PCIe 3.0X2端口独立,互相不影响,为系统修复和异常处理提供了硬件基础,保证了系统双控冗余性,提升系统的可靠性。其次,商用的NVMe SSD盘必须要支持快速在线更换,而传统PCIe的热插拔的易用性体验不佳,特别是暴力热插拔会导致系统异常,业务中断。华为存储在PCIe积累多年,它的做法是依靠完善的PCIe链路管理、PCIe异常处理技术、PCIe热拔插技术,并对PCIe驱动做了特殊设计。在这一系列技术的支持下,华为全闪存可以支持SSD盘在任何时间、以任何方式拔出,并提供端到端的PCIe系统可靠性。再次,是市场进入大盘时代后,海量数据带来的可靠性压力。在这一点上,华为全闪存为市场带来了创新的RAID-TP软件技术。它基于Erasure Code算法,将校验位做到支持1、2、3位可调,甚至可以容忍同一个RAID组内1~3块盘同时失效,并确保数据不丢失,业务不中断。值得一提的是,目前业内包括华为仅有3家企业能够做到这一点,而华为的重构速度是达到了同类厂商的20倍之多。最后一点和跨站点可靠性相关。要知道,存储单点的可靠性已经是一个难题,面对跨站点的可靠性必然是一个挑战。围绕这一挑战,华为NVMe全闪存依托完备的数据保护技术,如快照、克隆、远程复制等,可以帮助客户建立从本地到同城数据中心,以及异地数据中心的层层递进的数据保护方案。以双活方案为例,华为又是率先在NVMe全闪存领域实现免网关双活方案的厂商。基于闪存的硬件和软件优化,它使双活时延达到了1ms,同时RPO为0,RTP也约等于0,保障了业务的7*24高可用。正是因为这些表现,在全球著名技术分析机构DCIG最新发布的《DCIG 2020年-2021年全闪存阵列购买指南》中,华为OceanStor 存储 Dorado系列在最佳推荐中位列榜首。在这份指南中,华为的OceanStor Dorado V6系列和OceanStor F V5系列皆入围推荐产品。其中,OceanStor Dorado V6正是华为存储去年刚发布的全新一代OceanStor存储Dorado系列高端全闪存。最初,NVMe进入存储网络领域,是为了在存储与计算之间建造一条高速公路;现在,它带来的价值显然已经远不止于此了。接下来,NVMe能否真的像Gartner所预言的那样快速增长,实现翻番,我们不妨拭目以待。