西部数据售前技术顾问叶扶军:变革中的企业级存储部件

  • ODCC /
  • 25 April 2018

大家好,我是叶扶军,来自西部数据公司。西部数据公司是一家老牌的做硬盘的公司,近些年我们连续收购了日立硬盘,同时收购了闪迪。
在开始话题之前,我先读两条最近在跟大家聊的一些东西,基本上每个月我都会被大家问到一个问题,机械硬盘什么时候要熄火?SSD什么时候能够取代机械硬盘?同时我看到有一些微信公众号上发的标题,我念一下,连续发了两个,第一个叫《硬盘发展史之机械硬盘:一段历史带你领略机械硬盘的兴衰》,另一个叫《SSD什么时候能和硬盘一样便宜》,我想这也代表了大家的观察。也说明大家虽然对机械硬盘某些方面的性能有些不太满意,但是在目前的阶段好像是欲罢不能,如果不用机械硬盘,像现在大家在构建的数据中心里,各种大数据、大流量存储,基本上是没办法的。据我观察,有许多的企业级采购里,对SSD的采购,采购成本上已经非常高了,有些跟硬盘差不多,甚至大于硬盘。全面采用闪存,在当前的情况下,从经济上是做不了的。今天我跟大家分享一下我们在市场上的一些观察。

西部数据售前技术顾问叶扶军

首先给大家回顾一下现在在企业级市场上正在发生的一些事情,包括技术方面的,还有一些自己对这方面的观察和展望。主要介绍一下在SSD和SCM未来的展望,最后讲一下机械硬盘,我们仍然有很强劲的技术在推动机械硬盘向前发展。机械硬盘目前在企业级数据中心里仍然是一个重要的组件。
大家在存数据的时候,在数据中心里好像现在不聊AI感觉落后了,前两年是不聊大数据就落后了。现在数据量产生的时候主要是几大块,第一是超大规模数据中心里,本身自己就能产生大量的数据。自己要做大量的海量的后端篮板,各种各样业务的需求,尤其是在现在,这上面只是展示了做机器学习、AI方面的时候,相信有很多专家对这方面理解得比我多。实际上在构建整个应用系统和业务系统的时候,需要应用两块的东西,比如在你的手机端,大家都在照相的时候,实际上是应用训练好的模型,在业务端可能要进行海量的训练,不同的端会应用到不同的存储介质、不同的产品。在大数据这一端构建的时候,大家更强调的是它的规模,它用海量的存储来提高精确性,提供的数据越多,精确性越高。消费端要更快的存储,视频采集,像智能车这一类,做这方面的时候里面往往用到的可能是NVMe的介质,因为有抗震动这方面的特性。采集到的数据往往会传输到像边缘数据中心里,以智能车为例,放到边缘数据中心里来做聚合。同时还会做双向交互,最后可能会归档到中间的数据中心里。这是大数据方面在AI方面的一个应用场景的用例。
在整个行业里,这是我们根据市场上的观察以及我们统计数值的一个图,目前来说,大概2020年,所有存储的数据字节有70%仍然要依靠硬盘,在企业硬盘里要占多少,下面这个蓝的和橙色的是企业级里的,这是按照目前的增长预测。
2020年大概有90%左右的字节还是要存在硬盘里。一般硬盘大家采购的容量和采购一个5G的容量,采购4T、8T,采购硬盘的可能在10T、12T。目前硬盘的出货量跟SSD已经越来越接近了。下面是数据中心里的,上面这块在消费级里大家的感受是被占据的比较多,这跟大家的体会是一样的,基本上现在笔记本已经很少用机械硬盘了。企业里像10000转和15000万这一类的采用越来越少。数据中心目前有大于90%的字节还在用硬盘。
现在各种存储组件、存储介质和技术已经积累了不少,除了我们应用最多的Flash还有HDD传统的Tape光盘,最近这些年尤其是以我们友商为代表的SCM这一类的兴起,我们在这些产品的定位主要分为两大类,第一类是用来做快速响应、高性能计算以及移动端抗震,另外一块是归为大数据这一类,像闪存这一块,它横跨两端,曾经有过很多的概念,有热存储、温存储、凉存储和冷存储,横跨了大数据存储的整个谱系。SSD占据了热数据以及需要最高的实时处理结构的快速数据的这两端。企业级硬盘最近一年有两个趋势,主要的驱动力实际上已经不是来自于传统的企业,传统的企业在这方面行动的速度以及它在新的特性的采用上没有云数据中心快,云数据中心的采用,基本上绝大多数的推动力都来自它,它推动接口的转换、形态的转换以及容量的转换,闪存接口协议这块,基本上现在在云数据中心里全面转向主流级的PCIe,成本基本接近SATA。NVMe还有一种性能非常高,高性能的PCIe,这块目前采用的量越来越少。传统企业级,传统上做存储,去年我们有很多人交流的时候曾经提到,双单口的NVMe SSD在企业级传统存储里的转换速度可能没有想象的快,但事实上我们过了一年以后发现这个结论有问题,现在双单口NVMe在主要的企业级存储里,已经成为了一个主要的推动力量,而且它会逐步的蔓延到传统SAS的领域里。NVMe少数的特性正在不断增强,像支持KV这一类的特性,这些东西基本上由云数据中心来进行推动。所谓做云,实际上就是一个总包商,从应用软件到系统到零部件,每一层都在做创新,这些新特性非常适合适配云数据中心,而不是传统的数据中心,往往它只需要有一个东西很快的工作就可以了,所以它对新特性并不是非常感冒。传统产品的谱系也在不断扩大,SCM已经开始采用,这一类的采用虽然没有预想那么快,但是还是在往前演进。另外多种形态的产品导入,比如像大家熟知的ruler,有长的和短的,这些新产品的形态,这种导入能够提升整个用户的使用体验,传统小尺寸的封装是一种利用传统硬盘的形态,利用了传统的机柜机箱的设计和散热。针对闪存以及未来的SCM需要一种新的形态,这种形态已经开始进入用户端的导入,所以它的发展也是超出了我们曾经的预期。有很多新的产品、新的技术。这些产品的导入对于云数据中心推动云进一步扩张它的地盘有非常重要的作用。从根本上来说,任何能够在不提高成本的情况提高性能,或者在不提高成本的情况下提高耐久度,这两个方面在SSD上的创新,都会潜在降低用户的TCU。这是显而易见的。
这里给大家分享一下我总结的在SSD方面目前的一些创新点。这些创新点都是现在已经正在发生的东西,比如介质,3D/QLC以及96层的NADA。如果需要有新产品来替代,来解决这个问题,SCM未来也许是一个比较理想的替代方案,它可能在某些程度上能够解决这方面短缺的问题。在Form Factor方面,未来可能是类似于DIMM形态的。NVMe方面,现在主协议方面的进展没有太多,NVMe已经是一个很成熟的协议了,大家已经在广泛采用,现在基本上已经把SATA挤得越来越小了。现在如果有新的NVMe的feature出来,无疑这个推动力量就是刚才提到的要跟云数据中心进行结合,因为云天然的就是把所有的东西都要尽量做到自己能够控制。目前还有一个创新,NVM Fabrics,已经落地了,在许多超大数据中心里已经应用了。技术的发展对这方面的推动力量非常大的。
硬盘好像现在已经很不力了,一说到硬盘好像是过去式的东西,实际上我们作为主流的硬盘厂商,在研发大量的技术来改进硬盘的容量、密度和性价比,以及给客户带来更多的价值。如果硬盘技术还在不停往前演进,它还是有它自己独有的竞争力的。
我们传统上用的垂直磁记录技术,这种技术发展了十多年,大概在2008年、2010年前后进入平台期,发展比较慢,现在大概能做到1.1T每平方英寸。再往上发展,因为它固有的物理上的限制,没有办法了。如果要提高磁盘的记录密度,现在需要有新的技术。现在从物理上有一个障碍,如果想突破1.4Tb每平方英寸,要突破这个密度几乎是不可能的。我们有一些新的技术可以来解决这一类问题,第一类是我们曾经整个业界讨论十多年的技术,我们也研发了十多年,热幅度磁记录技术,我们一共有500个专利,现在我们认为这个技术还要继续研发,这个技术我们认为还是未来很有希望的技术。但是现在我们要赶紧为用户提供最高密度的硬盘,我们同时并行研发另外一种技术,叫MAMR,叫微波辅助磁记录技术,在目前的阶段能够做到每年大概25%的密度提高。提高面积密度,一个是提高TPI,每英寸磁道数量,第二是提高BPI,每英寸比特数量。两个问题,第一个是机械定位,越小越难定位,第二是读写难度,第三是写入难度,我们这两年发布了一系列技术来解决,比如磁头,现在用了更精准的两段式定位技术,两段式字符,目前可以做到40-50万TPI,未来希望可以做到100万,也就是说理论上可以做到大于40T硬盘的。为什么现在非得用各种能量辅助技术,现在硬盘,我经常被问到一个问题,硬盘存上来的数据可靠吗,会不会被什么宇宙射线、微波辐射,数据没了,硬盘为了解决这些问题,下面的磁性材料要为它做很多工作,让它非常牢固可靠。也就是放在那,它几乎不可能自动来做翻转的。你把磁层搞得那么强,把它翻过来,来做写的操作,也非常困难,又把磁簇做得很小,磁头也小,不能再通过让它降低它的悬浮高度来解决这个问题。我们现在需要各种各样的能量辅助技术来解决这个问题,其中微波辅助磁记录我们研发了七八年,目前来看是一个很成熟的技术,它的成熟度我们评估在当前我们同时做HAMR和MAMR的情况下,我们现在认为MAMR已经快可以上市了,这个技术突破相信对整个业界都是好消息。HAMR里面有一个小激光器,比如一个盘有8个碟片,有16个磁头,就要16个小激光器,MAMR也需要16个微波辅助组件,加入到400-700度。热量天然的对硬盘这种介质比较敏感,所以需要换介质,需要换玻璃盘,如果是MAMR就不需要做这些东西,用传统的东西,上面加个小的微波辅助组件,调试好就可以了。这是一个演示的MAMR的小磁头,利用微波磁场来克服矫顽力。还有一个问题是读,磁头越来越小,离它越来越远,这种情况怎么来解决,我们刚刚发布的14T里用的一种新技术叫PMR,利用的是类似于差分消噪原理,提高信噪比。传统的TMR的情况下,它的提成长远来说还是比较有限。MAMR如果加上这一系列技术的叠加,未来有希望做得非常大。MAMR磁头目前我们测到的可靠性非常高,已经可以达到出厂的水平。我们现在基本上什么都不用改,改进磁头技术就可以把这个产品做出来。HAMR我们同时也在研究,我们认为这是一个比较有希望的技术。
如果用传统的PMR,到2025年只能做到20T,如果用MAMR大概做到40T。有一个价值体现,NADA Flash和硬盘大概价格差异是10倍,是基于现在已有的数据,同时考虑了3D QLC,上市以后再过多少年会不会有5BT的那种,目前来看聊这个还太早。考虑各种因素,放进来,大概有10倍左右的每TB的成本差异。对于需要存储海量数据的云数据中心来说,这是一个好消息,还有硬盘在后面来扛这么多的数据,90%,所以希望大家还能够继续喜欢硬盘,同时我们也在做SSD。
40TB,希望2025年能够顺利实现。顺利说一下,我们2019年预计能够发布16T,到2020年我们希望能够发布20T,后面速度就是4T、4T的往前走,不再像现在2T、2T。
谢谢大家!