繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

這顆博通芯片,漲到14萬

2023-08-23 22:01

行情圖

查看最新行情

  來源:芯世相

  一入AI深似海,原來不止是GPU價格在漲……

閲讀本文,你將瞭解:

1、博通SS26,為什麼這麼搶手?

2、為什麼缺?有替代嗎?

3、AI服務器還帶動哪些芯片增長?

01博通SS26價格漲至2萬美元

  AI相關GPU和服務器缺貨潮還在持續發酵,英偉達、AMD等GPU大廠持續加單,而大模型下AI服務器集眾多硬件與零部件於一身,GPU這頭的短缺還在填補,另一頭又開始短缺,你永遠不知道下一個缺的又是什麼部件。

今年6月初開始,博通的PCle Switch在市場上就有了缺貨跡象。

相關型號包括博通SS26、SS24、SS23打頭的芯片,詢價熱度較高,市場上找貨需求異常多,如SS26-0B00-02、SS24-0B00-02、SS23-0B00-02,其中SS26規格高,最為缺貨,規格低一些的SS24、SS23雖然沒那麼缺,也有不少人在找貨。

關於高端的SS26-0B00-02市場價格,業內人士告訴我們,目前其香港原裝報價是5500 USD/ 片(26片起購),到了深圳現貨市場,報價高達1.8萬-2萬 USD/片(含税),還不保證原裝。

  芯世相觀察到,某些型號帶目標價格也不一定能挖到現貨。比如SS23-0B00-02,有終端在海內外到處找貨,接受5000元單價,急需現貨。

  以上芯片型號,都屬於博通PEX89000 PCIe Gen 5.0系列交換機,目前是其針對數據中心和雲平臺的PCI快速交換機中的最新系列產品,應用於 ML/AI 和服務器/存儲應用的可組合超大規模計算系統。

規格最高的SS26-0B00-00具有144個PCIe Gen 5.0通道,可實現高達9216 Tb/s(1152 GB/s)的原始帶寬。

  因而博通的PEX89000系列交換機,可以説是為先進計算而生的AI芯片了。

博通PEX89000 PCIe Gen 5.0系列交換機型號,來源:broadcom.com

博通PEX89000 PCIe Gen 5.0系列交換機型號,來源:broadcom.com

PCle(PCI-Express,peripheral component interconnect express)即外圍組件快速互連,是一種高帶寬擴展總線。簡單來説,總線就是電腦內部進行交互的公用通道,可以理解為各種交通道路,PCle就是其中的一種。

  如果大家有自己裝機的經歷,就會在主板上看到水平的PCle插槽。

  PCle通常用於連接顯卡、固態硬盤以及採集卡和無線網卡等外設,也常用於服務器平臺,也越來越多地被用作存儲和GPU互連解決方案。

來源:intel.cn

來源:intel.cn

  主板上的PCle通道分為x1、x2、x4、x8 和x16幾種配置,通道數量越多意味着帶寬越高,插槽也就更長。我們組裝電腦時,GPU就通常安在x16插槽中。

  PCle既可以作為接口,又可以作為通道。當它是接口的時候,可以插帶PCle接口的任何外設:顯卡、無線網卡、USB接口、固態硬盤、聲卡等等,這個插槽里面,就有我們的PCle Switch芯片。

PCIe Switch,即 PCIe 開關或 PCIe 交換機,主要作用是實現 PCIe 設備互聯,像服務器要實現CPU、GPU等組件互聯,就離不開它。

  有了PCle Switch,PCle從端對端的連接,變成多條總線連接,有效拓展了鏈路,形成一個高速的PCIe互聯網絡,從而實現多設備通信。

  PCle Switch的高可拓展性、低功耗、低延迟、高可靠性、高靈活性等優勢,使之廣泛應用於機器學習、人工智能、超融合部署和存儲系統中。

PCIe Switch連接多條PCIe總線,來源:PCI-SIG官網,中金公司研究部

PCIe Switch連接多條PCIe總線,來源:PCI-SIG官網,中金公司研究部

  計算機內部包含PCle等各種總線協議,讓我們拆開一臺AI服務器內部看看。

以 NVIDIA HGX H100 8-GPU為例,8 塊 H100 GPU在全新的 FP8 精度下 AI 性能比上一代高 6 倍,可提供 900GB/s 的帶寬,該服務器內部包含NVLink、PCIe和QPI等主板總線。

NVLink方面,8張 GPU(H100)之間互聯主要通過4個第三代NVSwitch 芯片來實現。每個H100 GPU共通過18個NVLink 4.0(5+4+4+5)連接到4個NVSwitch芯片。每個NVSwitch相當於一個完全無擁塞的交換機,與8張H100 GPU卡實現完全連接。

  NVLink是英偉達基於PCle Gen4研發的新技術,是點對點的高速互聯技術,支持多達 16 個 GPU 或 CPU 的連接,可實現大規模的並行計算和深度學習訓練。

  英偉達A100、H100等GPU可以分PCle和NVLink兩種版本,GPU互聯時用的是不同通道。PCle版本的GPU互聯便是通過PCIe通道完成的,藉助PCIe switch,系統可以實現CPU-GPU,GPU-GPU的連接。

  多個GPU之間連接,PCIe僅64GB/S,4個以上的GPU互聯就較為吃力了。隨着AI和高性能計算需求不斷增長,需要更大的互聯帶寬,NVLink的帶寬是雙向帶寬,如NVLink 3.0的帶寬可以達到7200 Gbit/s,即900 GB/s,明顯優於PCIe,而且在每GPU連接數量上限也高達18張,GPU的性能就可以發揮到最大化,這也就是為啥黃老闆説買得越多省越多。

PCle方面,GPU與CPU之間通過PCIe 5.0總線實現互聯。圖中藍色方塊為 IP 網卡(CX7),既是網卡又能發揮PCIe Switch(5.0)擴展功能,成為 CPU 與H100(GPU)之間互聯的橋樑。CPU之間則仍使用QPI總線進行通信。

  可以看出,一臺AI服務器要實現GPU-CPU互聯,甚至是GPU之間的互聯,都離不開PCIe Switch芯片。來自博通SS26等芯片的需求普遍集中在服務器終端,它們也正是用於AI服務器的PCle Switch芯片。

AI服務器要PCle 4.0、5.0及以上版本,做這類產品的廠商少,價格很貴。」一位服務器專業人士告訴我們。

02 為什麼缺,有替代嗎?

  伴隨着AI 服務器、GPU等需求的增加,作為連接部件的PCle Switch需求也起來了。

目前用於AI服務器的4.0、5.0版本屬於PCle Switch中的先進版本。專業人士告訴我們,PCle Switch要看其支持的Lanes和Ports,參數越高,價格越貴。

  PCIe最早由Intel於2001年提出,2003年正式推出PCIe 1.0版本,到2022年已迭代至6.0。根據PCI-SIG官網,伴隨人工智能、自動駕駛、AR/VR等具有高運算要求的應用快速發展,處理器I/O帶寬每三年實現翻番,也促使PCIe基本上按照3年一代的速度更新演進。

PCle基本上平均每3年更新一代,其單通道速率都在翻倍增長,總帶寬也在提高。2022年PCI-SIG 正式發佈PCIe 6.0 規範,這是PCIe問世以來變化最大的一代,每通道數據傳輸速率從PCIe 5.0的32GT/s翻番至64GT/s,除了帶寬和效率的提升,還具有更低的延迟。2022年6月,PCI-SIG聯盟宣佈PCIe 7.0版規範,單條通道(x1)單向可實現128GT/s傳輸速率,計劃於2025年推出最終版本。

  別看PCIe 7.0版規範都出來了,博通的PCle Switch 5.0最近也被大家到處掃貨,但業內人士告訴我們,市場上對PCIe 5.0的需求實際上還沒起來,「其一是目前大規模出貨的CPU基本是PCIe 4.0,其二是英偉達A100/A800和國產GPU、NPU等也都是PCIe 4.0。」

目前用量大的仍是高端PCIe 4.0,且缺貨比較嚴重,在現貨市場,原來單價2000-3000 RMB現在漲到大幾千,甚至1萬元,供貨周期變長很多。而低端4.0產品需求越來越少,普通服務器為實現更大靈活度也往中高端走,供貨渠道不多,供貨周期也變長了,但價格只要小几千元。

  因此博通PCle Switch 5.0這類芯片的起量還沒那麼快,「預計國內要在2024年下半年起量,到時候CPU才基本升級到PCIe 5.0。另外,英偉達H800也支持5.0版本,一些加速卡應該會加入到5.0生態。」

那麼一臺AI服務器要用多少PCle Switch芯片,用量有多大?

我們從前文對AI服務器的內部拆解可以看出,CPU和GPU之間互聯的需求量不多,主要的用量在GPU之間的互聯。

如果你用的是A100 80G PCIE的8卡AI服務器,這里面8張A100互聯可能就要用到大量的PCle Switch,而NVLink版本的帶寬升級更大,GPU之間不用PCle Switch。

  不過,NVLink僅用於GPU之間,最終傳輸結果給GPU還是走PCle,「目前服務器都還是X86架構,所以基本都是PCle的IP,Intel本身並未支持NVLink。」CPU與GPU互聯離不開PCle Switch。

帶寬的高低,也是決定PCle Switch用量的重要因素,「還要看主帶寬是多少,比如它里面做了一個PCIe 5.0,64x,也就是説它可以同時產生64路PCle 5.0的x1(帶寬),那需求量就極大了。」

全球PCle Switch三大供應商,博通、微芯、祥碩科技三家,共佔有全球約58%的份額。據博通官網介紹,博通是PCI Express交換領域的領導者,出貨量超過10 億個,公司正通過行業領先的交換機系列以及新的重定時器解決方案推動數據中心連接的發展。

  如果要替換這顆博通芯片,目前可替代的微芯也面臨缺貨,而國產即便有替代,國外主板廠一般也不採用。據悉,美國一家新公司xconn-technology剛推出樣品,明年這時候就有對應產品上市。

隨着PCIe 在服務器中應用越來越廣泛,PCIe Switch 的市場需求也被帶動起來。根據QYResearch的統計及預測,2021年全球 PCIe 芯片市場銷售額達到了 7.9 億美元,預計2028年將達到 18 億美元,年複合增長率(CAGR)為 11.9%。

  我們知道,除了蘋果,英偉達、博通和AMD最近乘着AI熱潮都在臺積電積極投片生產。

這波博通PCIe Switch熱,與英偉達用於AI服務器的GPU缺貨邏輯基本一致,那就是尚未實現大規模出貨,近期才追加擴產,一段時間內面臨供應不足。

  博通也是受益於AI時代來臨的芯片大廠之一,除了與蘋果持續合作外,博通還陸續獲得了谷歌、Meta 等大廠的高級 ASIC 芯片訂單。博通作為通信巨頭,這些訂單估計包括了PCIe Switch在內的不少通信相關AI芯片。

博通FY23Q2財報顯示,博通目前AI營收佔半導體營收約15%,預計FY24提升至25%;與其他芯片廠商相比,博通在2-4月的單季營收同比增長了 8%,芯片業務表現超出市場預期。

博通還表示,AI相關部分產品從生產到交付需要超過6個月。博通CEO認為,未來傳統計算與AI計算會齊頭並進,AI增長更快,傳統計算不會消亡,未來增長一半來自傳統業務,一半來自AI。

03 結 語

據報道,AI服務器將大幅推升服務器平均出貨單價(ASP)由8500至9000美元上漲到1萬美元以上,AI服務器主要集中在今年第四季大量出貨。

  AI訓練的龐大數據,需要在各芯片之間高速無擁塞互聯。英偉達自己的NVLink、NVSwitch市場規模有限,而傳統CPU生態中的PCIe接口芯片及其他高速互聯芯片市場相對開放,PCIe Switch作為數據中心低功耗、高性能解決方案的核心一環,有望迎來高增長。根據Transparency市場調研機構數據,2019-2027年CAGR約15%,2027年全球PCIe Switch市場規模或將達到92億美元。

除了PCle Switch,AI服務器需求帶動服務器產業鏈上各環節價值增長,業內人士測算,相較普通雙路服務器,AI服務器核心器件單機價值量提升倍數由高到低依次為GPU(24x)DRAM(5.3x)板內互聯接口芯片(3.3x)、電源管理(3x)、散熱(3x)、PCB(2.4x)、網卡(2.2x)和SSD(2x)

普通和AI服務器價值量拆解及對比、AI服務器不同出貨量假設下各環節的市場規模測算,來源:IDC,英偉達,中金公司研究部

普通和AI服務器價值量拆解及對比、AI服務器不同出貨量假設下各環節的市場規模測算,來源:IDC,英偉達,中金公司研究部

  AI需求強勁,但需要看清的是,AI不足以撐起整個半導體行業的增長,近期晶圓代工廠們降價、熱停機動作亮起警示燈,目前半導體行業仍處於消費電子需求低迷陰影之下,復甦緩慢。

  以博通為代表的高端AI芯片市場,同樣是個玩家有限的小池子,它的稀缺與漲價反映一段時間內高端AI芯片供不應求,對於芯片市場多數從業者來説,行情尚在緩慢復甦,可遇而不可求,唯有繼續積極開發新產品、新技術、新客户,找到新的增長點,纔是以不變應萬變的關鍵所在。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。