一场始于云计算的软硬件变革,已经蔓延到了芯片行业甚至整个IT产业。没人能否认,新的大幕正徐徐拉开。
云厂商难抵挡的诱惑
自研DPU(Data Processing Unit),成为云厂商摆在台面上的要紧事。
国内外两家头部云厂商AWS和阿里云,在数年前不约而同踏入了同一条河流。2017年10月份,阿里云推出了神龙架构,同年12月,AWS推出Nitro,二者的目的都是为了减少虚拟化损耗,把服务器的所有底层资源充分利用起来。
阿里巴巴集团研究员、阿里云弹性计算产品线负责人张献涛表示,“过去云计算的硬件对于虚拟化技术的支撑非常少,效率非常低。比如它会有百分之十几到二十的性能损耗,百分之十几的资源损耗。从性价比上来讲,它和物理机相比直接损失二十到三十个点,这种情况下,其实只改软件和只改硬件其实都没有办法去解决这个问题。”
能否杜绝这种“浪费”,对于云计算厂商来说,可能就是下一次淘汰赛的入场券。
云厂商的种种动作也在印证着这个趋势,钛媒体App注意到,云厂商或多或少开始储备DPU资源,例如天翼云的紫金架构,腾讯云“水杉”“银杉”智能网卡以及智能网卡芯片“玄灵”,并且投资了DPU厂商云豹智能,华为的IN300/IN500产品,美团和百度先后投资了星云智联等。
公有云巨头或者有海量服务器及潜在应用场景的厂商们,纷纷通过自研和投资方式,参与到这场盛宴当中。
根据英伟达提供的数据,在NVIDIA BlueField DPU上运行vSphere,用的越多,省的越多。整个服务器效率方面会整体提升22%,在3年ROI角度测算带来5倍的投资回报率。
780台安装有NVIDIA BlueField DPU的服务器,相当于1000台安装有标准智能网卡的服务器。每台服务器的TCO(总体投入)可节省8200美元,3年内通过提升效率可节省180万美元。
而在云计算场景下,公有云厂商拥有数十万乃至上百万台服务器的数据中心,这是一笔稳赚不赔的买卖。
同时,从云计算竞争差异化的角度看,客户界面IaaS层资源趋于同质化,但在后台资源层面,具备DPU的云厂商,足以对没有DPU的厂商产生降维打击,这是战略竞争优势。
虚拟化是云服务的基础,没有虚拟化,就没有被抽象的资源池,云厂商也就不能在其上开展业务,由虚拟化带来的额外损耗在云计算初期不显,或者云厂商对此无能为力,随着现阶段云厂商由重规模扩张,到重视健康增长的转变,底层技术的优先级再度提高。
有意思的是,云厂商在推动DPU技术的早期,甚至还没有DPU的名称,大家在共同的大方向上默契探索,行业还没有开始收敛。
芯片厂商闻风而动
2019年,美国一家名为Fungible的初创公司提出了DPU的概念,同年英伟达以69亿美元价格收购了Mellanox,后者是业内知名的网络设备公司。2020年,英伟达基于Mellanox技术推出DPU产品Bluefield系列,点燃了全球DPU市场的热情。
英伟达CEO黄仁勋表示,DPU将成为未来计算的三大支柱之一,未来的数据中心标配是CPU+DPU+GPU,CPU用于通用计算、GPU用于加速计算、DPU则进行数据处理。
“数据中心已经成为全新的运算单位”,按照这种逻辑,CPU是以服务器为计算单位的中心,而DPU有望成为以数据中心为计算单位的中心,对芯片厂商是全新的市场,不亚于CPU和GPU的规模。
而DPU不只是芯片,而是包括软硬件在内的一系列产品,以Nitro为例,至少包括Nitro虚拟化管理程序、Nitro I/O加速卡和Nitro安全芯片、Nitro Enclaves(为计算实例提供CPU和内存隔离环境)、Nitro TPM(安全性和兼容功能)。
阿里云的新一代虚拟化架构还包含“X-Dragon虚拟化芯片”、“X-Dragon Hypervisor系统软件”、以及“X-Dragon服务器硬件架构”等,上下游厂商都瞄准了新芯片的机会。
作为中央处理器,CPU既要做计算,又要做管理,这种“既当爹又当妈”的情况,被DPU所改变,网络服务(虚拟交换、虚拟路由)、存储服务(RDMA、NVMe)、安全(防火墙、加解密)等都可以由DPU解决。
“Intel和AMD等公司以后再没有网络、存储、管控、虚拟化跑在CPU上了,这是巨大的浪费,所有这些都跑在DPU上,所以Google要和Intel合作,AMD收购了Pensando,Nvidia两年多前也看到这个趋势,美国一早就看到了大趋势,而中国落后了五年。”芯片行业专家Kenyon(化名)如此表示。
基于 DPU 组网的新型云计算示意
芯片大厂与初创企业闻风而动,市场的喧嚣与火热一并到来。
中科创星创始合伙人米磊是投资DPU行业的早期投资者之一,他主导投资了大禹智芯(2020年)和中科驭数(2018年)两家DPU厂商的天使轮,当时两家公司估值在一亿元人民币以下。大禹智芯2022年6月份宣布完成了A轮融资,融资金额未公布,中科驭数9月份宣布完成数亿元B轮融资。
“说实话,投这两个项目时还没有DPU概念,我们看到了整个数据中心大量的数据,需要一些专业的芯片去解决,后来这款芯片的应用前景足够大,从而独立成为一个处理单元。”米磊表示。
“2020年中大禹智芯成立之后,我见了大概50多家投资人,听说这个概念的就很少,也就10%,真正在找这个方向的只有他们一家(中科创星)”,大禹智芯CEO李爽说。
“今年资本市场比较冷淡,去年只要拿几页做DPU的PPT,再从云厂商挖一两个人,整个公司估值就过10个亿”,张献涛说。
DPU从一个较为冷门的赛道,到创业厂商批量涌现,只用了一两年光景,让很多人始料未及。根据中国信息通信研究院华东分院11月份发布的《DPU行业发展研究报告(2022年)》,2016年至今,DPU厂商合计发生融资近30 笔。
从融资年份上看,截至2022年9月,2021年和2022年共发生融资22笔,占比超过75%,其中,2021年以14笔融资位居*,融资笔数占总数的比重接近50%,2022年也已发生8笔融资。从融资轮次上看,DPU企业融资主要集中于A轮和Pre-A轮,随着DPU行业的持续发展,2022年,融资轮次逐步后移,开始出现B轮融资。
据钛媒体App不完全统计,近一两年DPU公司融资还包括:
2021年8月,星云智联完成数亿元A轮融资,由美团*投资;2022年2月,引入百度作为战略投资方。2022年3月,芯启源完成数亿元超亿元战略投资。2022年4月,云脉芯联宣布获得数亿元人民币PreA轮投资。2022年6月,益思芯科技宣布完成新一轮数亿元人民币的融资。
芯片行业受资本关注,且单轮融资额度高的特性,在DPU行业得到进一步彰显。目前DPU赛道估值最高的公司是云豹智能,今年6月云豹智能宣布完成B轮融资,融资后估值约90亿元。
大热之后,DPU行业迎来了调整与反思,烧钱融资、做产品和找客户,是接下来的行业主线。
DPU产业图谱(来源:DPU行业发展报告)
三重难关
资本关
受大环境影响,2022年的资本市场更为冷静,而DPU仍处于烧钱阶段,不具备持续融资能力的DPU厂商,或许成为*被淘汰的一批。
钛媒体App接触的多家DPU厂商都表示,短期内还会有融资计划,相比其他领域的投融资项目,DPU厂商受到的影响较小,大概率今年会有一个回落,但幅度不大。
“在芯片行业里,如果不是头部企业,懂行业的投资者是不会投的,因为二三线的芯片公司大部分很难为投资者带来回报。”云豹智能创始人萧启阳对钛媒体App表示。
他解释:“在美国,过去十年间从创业到上市的芯片公司寥寥可数,因此大部分投资者都只能希望其投资的芯片创业公司被已上市的芯片公司收购,从而获得回报。而在国内,芯片行业的企业并购非常罕见,大部分投资者只能通过其投资的公司上市来获取收益。而芯片行业相对其他行业来说,投资周期很长,而财务投资者首先会关心的问题是项目回报多大,如何退出、时间多长、风险多高,如果一个项目的投入需要等10年才能获得回报,并且还有很大的不确定性,大部分的投资者都不会考虑的。”
“做像DPU这样的大芯片,除了购买IP、流片等研发费用,还需要至少300-400人以上的硬件、软件和技术支持等高端技术专家持续多年投入,加上新产品的开发和产品迭代,花费至少需要20亿以上人民币。我们面对的不单是国内市场,还有海外市场。”他补充道。
DPU厂商不能只看资本运作,更要看重产业资源。云豹智能的投资方包括了中芯国际、红杉资本、深创投、腾讯等,腾讯是云豹的*大外部股东,连续三轮都投资了云豹智能。资本投资人及产业投资人希望云豹成为“中国的博通”。
DPU厂商估值的水涨船高,也让一部分投资者慎重考虑是否入局和追投。另一位投资者认为,“现在(DPU公司)看上去显得有点贵,但是高速增长能够消化的话,也没有问题。历史经验证明,融资融得好的企业,未必是最后的赢家,”
他认为,对于现阶段的DPU厂商来说,VC的钱比客户的钱更好拿,但融资和营收是两码事,未来几年,行业会明显更加关注营收,关注企业自身是否有造血能力。
李爽也提到,“从资本市场来讲,DPU市场不像去年那么火,但是从另外一个角度,用户层面的情况要比去年好,很多客户已经看到了这个产品并且愿意去尝试。”
产品关
“没有”,若论商业化的成熟DPU产品,李爽给出了他的答案。
“DPU现在在云计算领域的迭代速度还是有点快,这么快的迭代速度,对于硬件来讲并不划算,大家都希望场景和需求达到一个相对成熟的状态之后,再将产品完善,我认为会在2024年左右。”
他进一步指出,“DPU行业不同公司的视角不同,做出来的效用或者结构可能不一样,但条条大路通罗马,新产品就是不断探索的过程,DPU还没有一个事实标准。”
目前云厂商和芯片厂商都以FPGA为主,好处是灵活可编程,减少试错成本,DPU厂商希望借此把软件和业务先打通,但是FPGA不是DPU的成熟形态,其性能、频率等都受到限制,ASIC是公认的下一代DPU形态。
天翼云资深研发专家、自研DPU技术负责人刘禄仁提到,“未来DPU大规模上量的话,肯定是ASIC化的产品,从功耗、成本还有性能来算,对云厂商应该是*解。当然要达到ASIC化,肯定针对的目标场景业务要成熟”。
据钛媒体App了解到,国内有DPU厂商已经开始裁员,也有DPU厂商的技术方案出现反复,前期硬件设计没有考虑周全的情况下,当网络带宽等指标进一步增长,只能推翻硬件重来,是一笔不小的成本损耗。现阶段相较于同期网卡型产品,DPU的成本估计在3到5倍之间。
目前,中国DPU创业公司大多做的并不是真正的DPU大芯片,而是基于FPGA的解决方案,就算有计划做芯片的,也只是做某单一功能的加速芯片,不少厂商希望分步探索,直至最终大芯片目标的实现。
一张芯片或卡卸载计算、存储和网络等负载,还是多张芯片或卡分别卸载,有本质差别。云豹智能此前用了不到一年的时间推出了一款基于FPGA的DPU解决方案,包含硬件及软件,投入了几十位技术人员去开发。
而目前云豹智能正在开发DPU大芯片,投入数百人力,相对于FPGA方案,其芯片功耗及成本都可降低一半以上,性能可提升3-4倍,通用性、灵活性、可编程性和易用性也有加强,这块DPU大芯片将于明年量产。
“美国已经实现了,中国的厂家也在学习,亚马逊(自研)、微软(FPGA)、Google(FPGA)都实现了,Google也知道用FPGA不能持续,才让Intel帮他们合作一颗芯片。”Kenyon说。英特尔和谷歌合作的IPU(Infrastructure Processing Unit,基础设施处理单元),也希望做ASIC化的大芯片。
客户关
客户也是DPU行业的一个大问题,按理说,云厂商是DPU的大客户,然而云厂商都倾向于自研,他们并不想等待通用产品,而是在自己的云场景下做*适配,这也与AWS和阿里云的示范效应息息相关。
一位云计算行业高管认为,“DPU创业厂商很难成功,因为他们对于客户业务的理解,对于整个软件栈的控制,作为一家芯片公司很难做到。”
“别人能做,我也能做”,云厂商走上软硬一体自研自用的方向,受伤害*的是芯片厂商们。
许多DPU厂商希望与云厂商沟通合作,一是做技术和需求上的交流,二是为了潜在的销售机会,而云厂商确定自研之后,厂商销售产品的意愿便少了许多。
张献涛表示,云计算提供了一个天然的场景,从软件到硬件再到上层服务,都是云计算公司在做,DPU创新之所以难,是因为单独软件公司、硬件公司很难结合在一起,很难对客户业务有深度的了解,技术的积累和认知也需要有一个过程。
今年6月份,阿里云推出了云基础设施处理器CIPU,它将取代CPU成为新一代云计算体系架构的核心。“CIPU是云计算软硬体系中的一个核心关键点,基于CIPU,我们会推动从数据中心底层到硬件体系的变革,更好适配数据中心‘风火水电’的标准”,张献涛说。
在最近举办的2022 re:Invent上,AWS Nitro推出了v5版本,晶体管数量增加一倍,内存性能提升50%,带宽提升两倍,相比于前一代产品,Nitro将显著改善延迟30%,同时每瓦性能提高40%,PPS提高60%。
也有观点认为,目前国内很多DPU创业公司已放弃云客户,是因为无法满足云厂商业务的需求。举一个最简单的例子,如何在芯片架构和配合的软件上支持在云上的热迁移功能?如果连这方面的经验都没有,做出来的DPU方案是很难成功的。
与此同时,DPU的场景也在向云计算之外发展,例如电信、安全和金融等。一些DPU选择了先在某些行业立足,譬如中科驭数选择了金融场景。信创场景也是国内DPU厂商的一个方向,DPU与数据紧密关联,硬件级的安全也有政企客户买账。
现阶段,不论是先选择行业,还是先打造产品,都需要不断地磨合与调整,行业格局尚未形成。
再思考,来路与出路
仁者见仁,智者见智。
DPU行业正处于类似的竞合状态,在这个时间点,有必要重新思考来路与出路——厂商做DPU应该补足哪些短板,又该如何推动DPU的进一步发展?
李爽谈到,DPU厂商竞争的压力更多来自己身,大家都在埋头做自己的产品,当然非要说竞争的话,市场上看得到的竞争更多的是融资上的竞争。
刘禄仁表示,DPU厂商的认知是*的门槛,云计算业务比较复杂,大家对需求的理解不同,虽然每一家技术演变都殊途同归,但毕竟每家都会有各种特点或差异,这是最主要的门槛。同时DPU不止用在数据中心,端网协同、5G场景、边缘场景也有需求,需求更加发散化。
同时他也提到,做芯片本身的门槛就比较高,DPU涉及到计算、存储、网络三个大方面,不仅有传统芯片设计里的验证驱动算法,还涉及到业务软件协议栈和用户程序等,比如AI芯片更多是一个单模块的功能点,DPU芯片软硬都要协同,让原本门槛很高的芯片开发,又拔高到一个新的维度。
Kenyon也给出了类似的答案,一家芯片创业公司是否能成功,其中一个必要条件为其团队是否做过类似的芯片。很多创业者连从研发芯片到量产以及运营一家企业需要多少人、多少时间、多少钱等问题都不清楚就开始创业,也不知道能为客户带来多大的价值,这样很难成功。
而关于DPU和其将影响的未来,张献涛从云计算的角度思考,以设计一个超级计算机的视角来看,底层技术变成一个完全软件定义的技术栈,软件定义数据中心以前是点状的改变,但是这些点状变成一个线、面的时候,它会带来新的革命。
相比于过去CPU发展历史上的缺位,中国云计算和海外云计算的行业差距并不大,在一些领域实现并跑,而由云计算场景推动的DPU软硬件变革中,新的历史正在写就。