AMD的DPU，打的什么算盘？

2022-08-23 10:09

半导体行业观察（ID：icbank）转载自公众号5G行业应用，作者：半山，谢谢。

收购、财报和市值

今年4月份，AMD宣布以19亿美元，收购DPU初创公司Pensando。近日，AMD发布2季度财报，营收同比增长70%。上周五，AMD NASDQ市值历史性的超越Intel（AMD：1530亿美元，Intel：1480亿美元）。Intel CEO Pat Gelsinger则表示，英特尔属于“咎由自取”，不过接下来会触底反弹。大佬这么说是有底气的，Intel目前市盈率6.03，AMD则为34.23，市值差不多的情况下，Intel一年的利润是AMD的5.68倍。

三个事情结合起来看，ZEN架构让AMD翻身成功，目前势头凶猛，当然TSMC先进工艺吊打牙膏厂功不可没。收购Pensando，技术方面补齐了数据中心拼图中的最后一块短板，市场方面自然也给与积极反馈。那让AMD大手笔出手的Pensando乃何方神圣，Fungible又是哪路神仙，今天的文章，就从创始团队背景、技术路线图，以及数据中心的演进和趋势等方面，和大家一探究竟。

MPLS传奇四杰

在我的上一篇文章，“从DPU看未来网络架构的演进趋势”中，我们讲过MPLS技术，Pensando的四位创始人，江湖人称MPLS四杰，所以我们先来简单回顾一下MPLS。简单来讲，层2的Eth和层3的IP，都是无连接 + 尽力而为，属于不可靠传输，而MPLS可以看做OSI模型中的2.5层，向IP提供连接服务，本质是隧道技术的一种，L2可以采用Eth，也可以用其它的层2技术。

传统路由中，分为动态路由和静态路由，动态路由主要由RIP、OSPF、BGP这些路由协议（通过UDP/TCP承载），在Gateway路由器之间同步路由表，实际上是无连接的分布式处理，因为IP网络是M国军方设计的，一开始的目标，就是在极端情况下，各核心部门，依然能够保持通讯畅通，所以分布式、去中心化的设计是必然的，带来的额外负担，就是每个路由器节点，都要维护一个巨大的路由表。

MPLS架构中，为了快速建立连接、减少路由表的查找和维护负担，会根据路由协议下发的路由表信息，由边缘路由器节点，生成局部标签，这个Tag就相当于一条虚拟的链接标识，后面MPLS网络的内部路由器，就可以根据标签直接转发，相当于对路由表进行了提取和抽象，后面直接使用即可，所以MPLS和动态路由，还是有很多关联。

Pensando的四位创始人，就是鼎鼎大名的前思科MPLS四杰，分别是Mario Mazzola、Prem Jain、Luca Cafiero和Soni Jiandani，MPLS就是他们四个人的名字缩写，至于后来的Multi Protocol Label Switching缩略语，大家听听就好，虽然名字起的也不错。

四位大佬于2016年从Cisco集体离职，创办了Pensando，离职原因也不复杂，前任CEO Chambers退休后，新任CEO上台，先后把四位大佬调到了顾问的岗位，他们的离职声明中也说了，深感当前岗位和职责的不契合之处。恩，说的还比较委婉，毕竟做事留一线，日后好相见。

熟悉MPLS和思科故事的业内人都知道，这个团队曾先后将三家孵化的初创公司，高溢价卖给Cisco，赚的盆满钵满，闹的思科内部意见很大。这就好比踢了一场球，有一个人先后铲了你三次，还说自己不会踢，真不是故意的。顺便说一句，Cisco时任CEO，就是赫赫有名的John Chambers，目前是JC2 Ventures投资机构CEO，之前也投了Pensando。

2019年10月，Pensando宣布Chambers担任董事会主席，大家体会一下圈子的真正意义。

Pensando的产品定位

Pensando在产品上线之前，非常的低调，目前能找到的相关技术资料也不多。客户覆盖了高盛、NetApp、Equinix、HPE，从国际投行，到存储和数据中心巨头，明显看得出来，客户都是精挑细选，非常有针对性。对自家公司的定位，我们可以从Pensando CEO Prem Jain，接受SDxCentral采访时的表态，一窥端倪。

“它是一个软件定义的分布式服务平台，针对边缘进行加速，始终安全，并面向云、企业以及服务提供商客户”。

关键词：分布式服务平台。这里面需要注意，边缘指的是数据中心服务器等计算单元，和DC网络之间的位置，而不是大家通常认为的边缘计算。5G里面的MEC边缘计算，是指为了降低数据面的处理时延，将部分之前核心网的数据面网元，下沉到距离终端用户地理距离更近的边缘节点，进行计算、处理。

问题来了，Pensando CEO所说的“软件定义的分布式服务平台”，和最近火热的DPU是什么关系，和前几年火热的分布式、软件定义又有什么关联？在回答这个问题之前，我们先来看看云计算平台的发展史。

云计算和去IOE

阿里是目前国内公有云一哥，IaaS市场的市占率37.8%，IaaS + PaaS市占率38.1%，实际上当初自研阿里云，四个字可以总结：消费降级。起初国内的金融机构、政府机关和初代的互联网厂商，都是采购IOE，他们分别是IBM的小型机、Oracle的数据库、EMC的高端企业存储。

多说一句，小型机不是小号的家用台式机，而是相对于IBM早期的大型机来说，要小一号（大型机属于比较早期的产品，那是真的大），实际上小型机就是高端、定制、高可靠的数据中心服务器，IBM一般采用PowerPC架构，片内和板级总线，也都是IBM主导的总线标准。

IOE的东西巨贵，阿里作为初创企业，用户数量激增后，如果同比例采购IOE设备，没等到阿里上市，就先破产倒闭了，所以云计算听起来高大上，实际上还是因为穷，要降本增效。

方法说起来也不复杂，就是用一堆普通的服务器，搭建高可用、分布式、大带宽、低时延的数据中心。方法说起来容易，阿里要去IOE，属于和AWS一样的先行者，当时业界各种分布式开源生态和成熟度，远远达不到商用的要求。就是时至今日，银行证券和金融机构的数据中心，IOE依然是主角，原因主要就两个，第一他们不差钱，第二他们领导不想因为IT降成本的事情丢乌纱帽。

不过数据库方面，最近一些年有了突破，Oracle和IBM的DB产品，目前已快降到50%，以达梦数据、人大金仓、神州通用和南大通用，为代表的国产数据库，正在狂飙突进，在银行、金融等ACID属性要求极高的场景，不停的吞噬国外巨头最后的市场堡垒。

我司的GoldenDB分布式数据库，和中信银行合作，实现中国首个大型银行分布式技术架构转型的战略目标，目前也已经顺利达成。关于关系型数据和分布式数据库，以及MySQL、NoSQL、NewSQL的故事，又可以再开一篇，先挖个坑。

普通x86服务器（计算）、HDD/SSD（存储）和交换机/路由器（网络），和IOE的关键差别，在于可用性、稳定性和带宽时延这些指标上，既然是消费降级，硬件自然是要条件差一些，但是业务要求不能降低，怎么破？

硬件不够，软件来凑，云计算闪亮登场。

软件定义方面，平时我们说的比较多的，是SDN、SDS，一般不咋说SDC（软件定义计算），因为计算这一块，在GPU和GPGPU普及之前，基本说的就是CPU，既然软件就是在CPU上跑的，再说软件定义计算，总有点怪怪的感觉。实际上云计算的IaaS、PaaS、SaaS，都可以理解成软件定义的分布式系统，底层技术分别对应虚拟化、容器和云原生（复合概念，可以另开一篇单说）。

DC革新进入深水区

既然云计算平台，天生是分布式、去/无中心化的，Pensando所说的软件定义分布式服务平台，是不是纯属概念营销，PUA咱们“善良淳朴的客户”呢？如果不是，这个平台的必要性和存在价值又在哪里呢？

云计算从软件层面，我们可以这样简单理解，把原本一个单体程序（代码逻辑+数据存储）打散，代码逻辑拆分成微服务，分散在DC的各个计算节点上，数据存储和计算分离，通过数据中心内部的分布式存储集群，为所有计算节点提供存储服务，所有的计算和存储节点，再通过普通网卡、SmartNIC、DPU和Leaf/Spine交换机/路由器连接起来。

云计算从IaaS、PaaS、SaaS到云原生，程序拆分的原来越细，微服务之间的rpc（远程过程调用）开销也随之快速提升，同时存储需求也越来越大（视频、图像等非结构化数据激增），加上存储和计算分离（HCI和SDS的优劣对比，又可以单开一篇，先挖个坑），SSD存储的高带宽和低时延，数据中心的网络带宽被迅速拉高。从1GE到10GE，业界花了很长时间，但从10GE到25GE/100GE、400GE，乃至最新的800GE，却非常迅速，背后的技术推力，就在于分布式计算和存储架构带来的网络带宽需求。

DC三大件，计算、网络、存储，就如同汽车三大件：发动机（提供动力）、变速箱（传输、分配动力）、底盘（承载车体，类比存储），三者互相依赖，任何一个都不能存在明显短板。

计算方面，先说CPU服务器芯片，不管是x86至强，还是ARM Neoverse N/V系列，短期内受限于摩尔定律放缓，性能提升空间不大，先进工艺和Chiplet，可以部分延续摩尔定律，但云计算平台主要是通过IaaS/PaaS/SaaS等分布式聚合技术，掩盖性能提升瓶颈。

计算方面，再来看看GPU/GPGPU和最近几年兴起的AI/ML加速器，英特尔故意压制PCIe速率和规格提升，贯彻以CPU中心的DC战略，Nvidia愤而开发NVLink，实现GPU直连，但只是解决了单机内的互联瓶颈。如何进行GPU/GPGPU的分布式和池化，关键点一方面是底层的网络互联（Nvidia收购了Mellanox），另一方面就是CUDA/AI模型的拆分、聚合（类似于大数据中的Map/Reduce模型），以及模型拆分后，如何同DPU进行整体的协同、优化。

网络方面，Spine/Leaf的交换机、路由器规格在持续提升，但服务器中的TCP/IP协议栈依然是软件处理，DPDK框架可以解决内存拷贝、中断处理、内核切换等部分软件开销，但网络带宽提升太快，CPU性能提升太慢，数据中心税（DC Tax）越来越高，非云用户直接开销的Offload势在必行，比如TCP/IP、OVS，实现BareMetal裸金属。

存储方面，VMWare（vSAN）和Nutanix，是HCI超融合市场双寡头，但HCI因为计算和存储统一部署，在中、小规模数据中心还可以应付，超大规模DC中，计算（CPU/GPU）和存储需求，常常是不对称，而且体量差异很大，SDS优势的更为明显。

软件定义的要点，在于抽象、池化、自动化，一般是通过控制面和数据面分离，软件实现控制面的策略下发、自动部署，硬件实现数据面加速，同时软件通过下发标准动作（类似OpenFLow流表），控制数据面的实际行为。

多说一句，目前的SDS，其实并不是软件定义存储，而是软件实现存储，和SDN软件定义网络的差别很大。以Ceph为例，Monitor监控、OSD对象存储、MDS文件系统Meta节点，统统都是软件实现，端到端的NVMeOF中，数据面的路径，如何和CPU、DPU、SSD主控，进行整合优化，加速器要实现哪些关键算法和处理的卸载、加速，如何同Ceph、GlusterFS、DPDK和SPDK进行协同，这里面的缘由和市场机会，得花钱才能买到。

综上，目前DC的整体性能和服务提升，进入技术整合和革新的深水区，而DPU作为计算和存储节点之间的必选和关键一环，融合了网络接口、业务卸载/加速的多重角色，走到了数据中心舞台的聚光灯下。

软件定义的分布式服务平台

软件定义的分布式服务平台，实际上是以解决DC典型分布式场景的整合、优化为出发点，通过软件定义的方法和DPU承载的方式，实现数据中心内，所有计算、网络、存储资源的池化、自动化和性能最大化。底层虽然是DPU来承载，但精髓和核心，在于软件定义的分布式框架。

从Pensando发布的DSC分布式服务卡和Aruba交换机来看，Pensando在创业的第一阶段，解决了底层DPU的有无问题，并根据投资方金主大客户的场景，提供了一些定制化的解决方案，还没有进入到关键的分布式框架构建，就成功上岸了，可能这个就是终极目标了吧，人生赢家。

Juniper传奇再出发

聊完Pensando，再来看Fungible。如果说MPLS四杰是成功的连续创业者，那么Fungible董事会主席，则是大名鼎鼎的Juniper创始人: Pradeep Sindhu。Juniper作为和Cisco齐名的通讯巨头，能让它的创始人离职创业的，得是多大的诱惑力和市场前景。

实际上，DPU的概念就是源于Fungible，还有他们那篇著名的TrueFabric白皮书，只是后来黄教主的Nvidia收购了Mellanox以后，教主觉得这是DC的第三颗大芯片，得有一个响亮的名字，GPU是N家发明的，CPU也已经有了，就叫它DPU吧，话语权从来都是掌握在大佬手里的，DPU一炮走红。

记得AMD刚收购Pensando的时候，有一篇文章，标题就是Fungible输在了哪里，大概意思是Pensando成功被收购了，起步更早、名声更大的Fungible为啥没被AMD看上呢？文章结论是Fungible主攻存储，不像Pensando重点布局P4和数据面可编程，事实真是这样吗？

打开Fungible官网，看一下产品列表和解决方案，对比TrueFabric DPU白皮书，其实不难发现，Fungible和目标和Pensando非常类似，都是软件定义的分布式服务平台，而且他们走的更远、做的更深。

Fungible的核心，在两点：

1、以TrueFabric为技术核心，基于FCP协议，构建底层DPU芯片

2、以DPU为载体（计算和网络），面向DC典型场景，构建分布式平台

先看TrueFabric，从它的白皮书入手，不难发现其基于UDP/IP，实现了可伸缩性、低延迟、拥塞避免、公平调度、误差控制，核心在于FCP协议及其硬化实现。FCP（Fabric Control Protocol），基于UDP/IP，意味着可以兼容现有的交换机/路由器等网络节点，硬化意味着实现了媲美RDMA的时延和带宽，其实有点类似于RoCEv2。

再看DC典型场景，以存储、GPU、AI/ML为例。

分布式存储领域，FSC基于DPU和NVMeOF，实现了媲美Dell EMC PowerMax的IPOS和延迟指标。控制面的Composer实现元数据管理和策略下发，数据面的Storage Node，单节点可以接入24块PCIe SSD，7个存储节点 + 1个控制节点，实现1500M的读IPOS和420GB的存储带宽，额外时延只有10us，带宽、时延等各方面指标不输PowerMax。

分布式GPU方面，通过GPU Connnect和类似存储的Composer节点，实现数据中心内，GPU节点的抽象、池化和自动化，当然AI/ML也同样支持。Fungible对自己的定位，“The Composable Infrastructure Company”，和Pensando的软件定义的分布式服务平台，其实非常类似，只是显然F家心更大。

结语：争议和机会

目光拉回国内，前段时间看了一个DPU技术大讲堂的报告，国内的几家初创企业，比如大禹智芯、中科驭数、云豹智能、益思芯，就分别从业务需求推动底层创新、存储与加速、基础架构创新、P4四个维度，解读了各自对DPU的理解和自家产品的布局考虑。各家产品定位，明显和各自创始人的背景强相关。比如大禹创始人，是原美团云总经理，主推从上而下的创新，中科驭数孵化自中科院，在TCP/IP卸载方面积累深厚，直奔NVMeOF，云豹背后金主是腾讯，挑战基础架构创新，显得更有底气。

再看看AWS的Nitro、阿里的神龙架构，本来也不是一张卡打天下，有Hypervisor虚拟化卸载卡，也有EBS弹性块存储加速卡，说明当前市场还处于百家争鸣的阶段，大家各自选择赛道发力，至于终点和目标，是不是软件定义的分布式服务平台，我们拭目以待。毕竟越是大机会，越是充满争议，越是小机会，反而更容易达成共识，科技发展史，几十年都是这样，最后结果会说话。

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3138内容，欢迎关注。

AMD的DPU，打的什么算盘？

推荐文章

新股暗盘 | 乐欣户外飙升超70%，中签一手账面浮盈4345港元；爱芯元智微涨超0.2%

高盛预计英伟达Q4营收达673亿美元 给出250美元目标股价

财报大跌背后：微软正在进行一场昂贵但精准的“利润置换”

港股IPO持续火热！下周6股排队上市，“A+H”占比一半

港股周报 | “AI红包大战”厮杀！腾讯周内暴跌近10%、阿里重挫8%，南下资金出手560亿港元大举抄底

美股机会日报 | 止跌企稳！纳指期货盘前涨约0.5%，有分析称美股连遭重挫后或回升；亚马逊盘前大跌超8%

一周财经日历 | 事关降息！美国1月非农、CPI数据下周公布；恒指季检结果下周五揭晓

华尔街大多头漫谈黄金“黑天鹅”风险：马斯克实现太空采金，化身全球央行行长

高盛预计英伟达Q4营收达673亿美元给出250美元目标股价