简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

AMD的DPU,打的什么算盘?

2022-08-23 10:09

半导体行业观察(ID:icbank)转载自公众号5G行业应用,作者:半山,谢谢。

收购、财报和市值

今年4月份,AMD宣布以19亿美元,收购DPU初创公司Pensando。近日,AMD发布2季度财报,营收同比增长70%。上周五,AMD NASDQ市值历史性的超越Intel(AMD:1530亿美元,Intel:1480亿美元)。Intel CEO Pat Gelsinger则表示,英特尔属于“咎由自取”,不过接下来会触底反弹。大佬这么说是有底气的,Intel目前市盈率6.03,AMD则为34.23,市值差不多的情况下,Intel一年的利润是AMD的5.68倍。

三个事情结合起来看,ZEN架构让AMD翻身成功,目前势头凶猛,当然TSMC先进工艺吊打牙膏厂功不可没。收购Pensando,技术方面补齐了数据中心拼图中的最后一块短板,市场方面自然也给与积极反馈。那让AMD大手笔出手的Pensando乃何方神圣,Fungible又是哪路神仙,今天的文章,就从创始团队背景、技术路线图,以及数据中心的演进和趋势等方面,和大家一探究竟。

MPLS传奇四杰

在我的上一篇文章,“从DPU看未来网络架构的演进趋势”中,我们讲过MPLS技术,Pensando的四位创始人,江湖人称MPLS四杰,所以我们先来简单回顾一下MPLS。简单来讲,层2的Eth和层3的IP,都是无连接 + 尽力而为,属于不可靠传输,而MPLS可以看做OSI模型中的2.5层,向IP提供连接服务,本质是隧道技术的一种,L2可以采用Eth,也可以用其它的层2技术。

传统路由中,分为动态路由和静态路由,动态路由主要由RIP、OSPF、BGP这些路由协议(通过UDP/TCP承载),在Gateway路由器之间同步路由表,实际上是无连接的分布式处理,因为IP网络是M国军方设计的,一开始的目标,就是在极端情况下,各核心部门,依然能够保持通讯畅通,所以分布式、去中心化的设计是必然的,带来的额外负担,就是每个路由器节点,都要维护一个巨大的路由表。

MPLS架构中,为了快速建立连接、减少路由表的查找和维护负担,会根据路由协议下发的路由表信息,由边缘路由器节点,生成局部标签,这个Tag就相当于一条虚拟的链接标识,后面MPLS网络的内部路由器,就可以根据标签直接转发,相当于对路由表进行了提取和抽象,后面直接使用即可,所以MPLS和动态路由,还是有很多关联。

Pensando的四位创始人,就是鼎鼎大名的前思科MPLS四杰,分别是Mario Mazzola、Prem Jain、Luca Cafiero和Soni Jiandani,MPLS就是他们四个人的名字缩写,至于后来的Multi Protocol Label Switching缩略语,大家听听就好,虽然名字起的也不错。

四位大佬于2016年从Cisco集体离职,创办了Pensando,离职原因也不复杂,前任CEO Chambers退休后,新任CEO上台,先后把四位大佬调到了顾问的岗位,他们的离职声明中也说了,深感当前岗位和职责的不契合之处。恩,说的还比较委婉,毕竟做事留一线,日后好相见。

熟悉MPLS和思科故事的业内人都知道,这个团队曾先后将三家孵化的初创公司,高溢价卖给Cisco,赚的盆满钵满,闹的思科内部意见很大。这就好比踢了一场球,有一个人先后铲了你三次,还说自己不会踢,真不是故意的。顺便说一句,Cisco时任CEO,就是赫赫有名的John Chambers,目前是JC2 Ventures投资机构CEO,之前也投了Pensando。

2019年10月,Pensando宣布Chambers担任董事会主席,大家体会一下圈子的真正意义。

Pensando的产品定位

Pensando在产品上线之前,非常的低调,目前能找到的相关技术资料也不多。客户覆盖了高盛、NetApp、Equinix、HPE,从国际投行,到存储和数据中心巨头,明显看得出来,客户都是精挑细选,非常有针对性。对自家公司的定位,我们可以从Pensando CEO Prem Jain,接受SDxCentral采访时的表态,一窥端倪。

“它是一个软件定义的分布式服务平台,针对边缘进行加速,始终安全,并面向云、企业以及服务提供商客户”。

关键词:分布式服务平台。这里面需要注意,边缘指的是数据中心服务器等计算单元,和DC网络之间的位置,而不是大家通常认为的边缘计算。5G里面的MEC边缘计算,是指为了降低数据面的处理时延,将部分之前核心网的数据面网元,下沉到距离终端用户地理距离更近的边缘节点,进行计算、处理。

问题来了,Pensando CEO所说的“软件定义的分布式服务平台”,和最近火热的DPU是什么关系,和前几年火热的分布式、软件定义又有什么关联?在回答这个问题之前,我们先来看看云计算平台的发展史。

云计算和去IOE

阿里是目前国内公有云一哥,IaaS市场的市占率37.8%,IaaS + PaaS市占率38.1%,实际上当初自研阿里云,四个字可以总结:消费降级。起初国内的金融机构、政府机关和初代的互联网厂商,都是采购IOE,他们分别是IBM的小型机、Oracle的数据库、EMC的高端企业存储。

多说一句,小型机不是小号的家用台式机,而是相对于IBM早期的大型机来说,要小一号(大型机属于比较早期的产品,那是真的大),实际上小型机就是高端、定制、高可靠的数据中心服务器,IBM一般采用PowerPC架构,片内和板级总线,也都是IBM主导的总线标准。

IOE的东西巨贵,阿里作为初创企业,用户数量激增后,如果同比例采购IOE设备,没等到阿里上市,就先破产倒闭了,所以云计算听起来高大上,实际上还是因为穷,要降本增效。

方法说起来也不复杂,就是用一堆普通的服务器,搭建高可用、分布式、大带宽、低时延的数据中心。方法说起来容易,阿里要去IOE,属于和AWS一样的先行者,当时业界各种分布式开源生态和成熟度,远远达不到商用的要求。就是时至今日,银行证券和金融机构的数据中心,IOE依然是主角,原因主要就两个,第一他们不差钱,第二他们领导不想因为IT降成本的事情丢乌纱帽。

不过数据库方面,最近一些年有了突破,Oracle和IBM的DB产品,目前已快降到50%,以达梦数据、人大金仓、神州通用和南大通用,为代表的国产数据库,正在狂飙突进,在银行、金融等ACID属性要求极高的场景,不停的吞噬国外巨头最后的市场堡垒。

我司的GoldenDB分布式数据库,和中信银行合作,实现中国首个大型银行分布式技术架构转型的战略目标,目前也已经顺利达成。关于关系型数据和分布式数据库,以及MySQL、NoSQL、NewSQL的故事,又可以再开一篇,先挖个坑。

普通x86服务器(计算)、HDD/SSD(存储)和交换机/路由器(网络),和IOE的关键差别,在于可用性、稳定性和带宽时延这些指标上,既然是消费降级,硬件自然是要条件差一些,但是业务要求不能降低,怎么破?

硬件不够,软件来凑,云计算闪亮登场。

软件定义方面,平时我们说的比较多的,是SDN、SDS,一般不咋说SDC(软件定义计算),因为计算这一块,在GPU和GPGPU普及之前,基本说的就是CPU,既然软件就是在CPU上跑的,再说软件定义计算,总有点怪怪的感觉。实际上云计算的IaaS、PaaS、SaaS,都可以理解成软件定义的分布式系统,底层技术分别对应虚拟化、容器和云原生(复合概念,可以另开一篇单说)。

DC革新进入深水区

既然云计算平台,天生是分布式、去/无中心化的,Pensando所说的软件定义分布式服务平台,是不是纯属概念营销,PUA咱们“善良淳朴的客户”呢?如果不是,这个平台的必要性和存在价值又在哪里呢?

云计算从软件层面,我们可以这样简单理解,把原本一个单体程序(代码逻辑+数据存储)打散,代码逻辑拆分成微服务,分散在DC的各个计算节点上,数据存储和计算分离,通过数据中心内部的分布式存储集群,为所有计算节点提供存储服务,所有的计算和存储节点,再通过普通网卡、SmartNIC、DPU和Leaf/Spine交换机/路由器连接起来。

云计算从IaaS、PaaS、SaaS到云原生,程序拆分的原来越细,微服务之间的rpc(远程过程调用)开销也随之快速提升,同时存储需求也越来越大(视频、图像等非结构化数据激增),加上存储和计算分离(HCI和SDS的优劣对比,又可以单开一篇,先挖个坑),SSD存储的高带宽和低时延,数据中心的网络带宽被迅速拉高。从1GE到10GE,业界花了很长时间,但从10GE到25GE/100GE、400GE,乃至最新的800GE,却非常迅速,背后的技术推力,就在于分布式计算和存储架构带来的网络带宽需求。

DC三大件,计算、网络、存储,就如同汽车三大件:发动机(提供动力)、变速箱(传输、分配动力)、底盘(承载车体,类比存储),三者互相依赖,任何一个都不能存在明显短板。

计算方面,先说CPU服务器芯片,不管是x86至强,还是ARM Neoverse N/V系列,短期内受限于摩尔定律放缓,性能提升空间不大,先进工艺和Chiplet,可以部分延续摩尔定律,但云计算平台主要是通过IaaS/PaaS/SaaS等分布式聚合技术,掩盖性能提升瓶颈。

计算方面,再来看看GPU/GPGPU和最近几年兴起的AI/ML加速器,英特尔故意压制PCIe速率和规格提升,贯彻以CPU中心的DC战略,Nvidia愤而开发NVLink,实现GPU直连,但只是解决了单机内的互联瓶颈。如何进行GPU/GPGPU的分布式和池化,关键点一方面是底层的网络互联(Nvidia收购了Mellanox),另一方面就是CUDA/AI模型的拆分、聚合(类似于大数据中的Map/Reduce模型),以及模型拆分后,如何同DPU进行整体的协同、优化。

网络方面,Spine/Leaf的交换机、路由器规格在持续提升,但服务器中的TCP/IP协议栈依然是软件处理,DPDK框架可以解决内存拷贝、中断处理、内核切换等部分软件开销,但网络带宽提升太快,CPU性能提升太慢,数据中心税(DC Tax)越来越高,非云用户直接开销的Offload势在必行,比如TCP/IP、OVS,实现BareMetal裸金属。

存储方面,VMWare(vSAN)和Nutanix,是HCI超融合市场双寡头,但HCI因为计算和存储统一部署,在中、小规模数据中心还可以应付,超大规模DC中,计算(CPU/GPU)和存储需求,常常是不对称,而且体量差异很大,SDS优势的更为明显。

软件定义的要点,在于抽象、池化、自动化,一般是通过控制面和数据面分离,软件实现控制面的策略下发、自动部署,硬件实现数据面加速,同时软件通过下发标准动作(类似OpenFLow流表),控制数据面的实际行为。

多说一句,目前的SDS,其实并不是软件定义存储,而是软件实现存储,和SDN软件定义网络的差别很大。以Ceph为例,Monitor监控、OSD对象存储、MDS文件系统Meta节点,统统都是软件实现,端到端的NVMeOF中,数据面的路径,如何和CPU、DPU、SSD主控,进行整合优化,加速器要实现哪些关键算法和处理的卸载、加速,如何同Ceph、GlusterFS、DPDK和SPDK进行协同,这里面的缘由和市场机会,得花钱才能买到。

综上,目前DC的整体性能和服务提升,进入技术整合和革新的深水区,而DPU作为计算和存储节点之间的必选和关键一环,融合了网络接口、业务卸载/加速的多重角色,走到了数据中心舞台的聚光灯下。

软件定义的分布式服务平台

软件定义的分布式服务平台,实际上是以解决DC典型分布式场景的整合、优化为出发点,通过软件定义的方法和DPU承载的方式,实现数据中心内,所有计算、网络、存储资源的池化、自动化和性能最大化。底层虽然是DPU来承载,但精髓和核心,在于软件定义的分布式框架。

从Pensando发布的DSC分布式服务卡和Aruba交换机来看,Pensando在创业的第一阶段,解决了底层DPU的有无问题,并根据投资方金主大客户的场景,提供了一些定制化的解决方案,还没有进入到关键的分布式框架构建,就成功上岸了,可能这个就是终极目标了吧,人生赢家。

Juniper传奇再出发

聊完Pensando,再来看Fungible。如果说MPLS四杰是成功的连续创业者,那么Fungible董事会主席,则是大名鼎鼎的Juniper创始人: Pradeep Sindhu。Juniper作为和Cisco齐名的通讯巨头,能让它的创始人离职创业的,得是多大的诱惑力和市场前景。

实际上,DPU的概念就是源于Fungible,还有他们那篇著名的TrueFabric白皮书,只是后来黄教主的Nvidia收购了Mellanox以后,教主觉得这是DC的第三颗大芯片,得有一个响亮的名字,GPU是N家发明的,CPU也已经有了,就叫它DPU吧,话语权从来都是掌握在大佬手里的,DPU一炮走红。

记得AMD刚收购Pensando的时候,有一篇文章,标题就是Fungible输在了哪里,大概意思是Pensando成功被收购了,起步更早、名声更大的Fungible为啥没被AMD看上呢?文章结论是Fungible主攻存储,不像Pensando重点布局P4和数据面可编程,事实真是这样吗?

打开Fungible官网,看一下产品列表和解决方案,对比TrueFabric DPU白皮书,其实不难发现,Fungible和目标和Pensando非常类似,都是软件定义的分布式服务平台,而且他们走的更远、做的更深。

Fungible的核心,在两点:

1、以TrueFabric为技术核心,基于FCP协议,构建底层DPU芯片

2、以DPU为载体(计算和网络),面向DC典型场景,构建分布式平台

先看TrueFabric,从它的白皮书入手,不难发现其基于UDP/IP,实现了可伸缩性、低延迟、拥塞避免、公平调度、误差控制,核心在于FCP协议及其硬化实现。FCP(Fabric Control Protocol),基于UDP/IP,意味着可以兼容现有的交换机/路由器等网络节点,硬化意味着实现了媲美RDMA的时延和带宽,其实有点类似于RoCEv2。

再看DC典型场景,以存储、GPU、AI/ML为例。

分布式存储领域,FSC基于DPU和NVMeOF,实现了媲美Dell EMC PowerMax的IPOS和延迟指标。控制面的Composer实现元数据管理和策略下发,数据面的Storage Node,单节点可以接入24块PCIe SSD,7个存储节点 + 1个控制节点,实现1500M的读IPOS和420GB的存储带宽,额外时延只有10us,带宽、时延等各方面指标不输PowerMax。

分布式GPU方面,通过GPU Connnect和类似存储的Composer节点,实现数据中心内,GPU节点的抽象、池化和自动化,当然AI/ML也同样支持。Fungible对自己的定位,“The Composable Infrastructure Company”,和Pensando的软件定义的分布式服务平台,其实非常类似,只是显然F家心更大。

结语:争议和机会

目光拉回国内,前段时间看了一个DPU技术大讲堂的报告,国内的几家初创企业,比如大禹智芯、中科驭数、云豹智能、益思芯,就分别从业务需求推动底层创新、存储与加速、基础架构创新、P4四个维度,解读了各自对DPU的理解和自家产品的布局考虑。各家产品定位,明显和各自创始人的背景强相关。比如大禹创始人,是原美团云总经理,主推从上而下的创新,中科驭数孵化自中科院,在TCP/IP卸载方面积累深厚,直奔NVMeOF,云豹背后金主是腾讯,挑战基础架构创新,显得更有底气。

再看看AWS的Nitro、阿里的神龙架构,本来也不是一张卡打天下,有Hypervisor虚拟化卸载卡,也有EBS弹性块存储加速卡,说明当前市场还处于百家争鸣的阶段,大家各自选择赛道发力,至于终点和目标,是不是软件定义的分布式服务平台,我们拭目以待。毕竟越是大机会,越是充满争议,越是小机会,反而更容易达成共识,科技发展史,几十年都是这样,最后结果会说话。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3138内容,欢迎关注。

推荐阅读

★为了提升密度,闪存厂商们拼了

★路子越走越宽的GaN

★汽车芯片为啥还缺?车厂该反思了!

半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度

识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复投稿,看《如何成为“半导体行业观察”的一员 》

回复搜索,还能轻松找到其他你感兴趣的文章!

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。