繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

50%能耗縮減 14% IPC性能提升 更強悍的鋭炫核顯 詳解英特爾酷睿U

2024-09-04 06:57

在今年6月份的臺北電腦展上正式公佈Lunar Lake處理器架構細節之后,有關於英特爾新一代酷睿Ultra處理器,即酷睿Ultra 200V系列的性能與能效表現就備受用户期待。全新的Lion Cove性能核以及Skymont能效核到底會給新款酷睿Ultra平臺帶來怎樣的性能?在Metoer Lake不錯的能效表現基礎上是否能夠進一步提升能效比?以及新平臺在本地化AI算力大幅提升之后,投射到應用端到底會給用户帶來怎樣的新體驗?這些問題成爲了新一代酷睿Ultra平臺最值得期待的關鍵點。

·Lunar Lake架構設計四大目標

轉眼時間來到9月,柏林IFA展前,英特爾終於公佈了Lunar Lake平臺的能效、性能以及應用表現,同時也公佈了新平臺的具體上市時間。本次酷睿Ultra 200V系列新品將於9月24日上市,首批包含九款不同型號的處理器,最高為酷睿Ultra 9 288V。新品全部採用8核8線程設計,睿頻加速頻率最高為5.1GHz,緩存最高為12MB。Ultra 7核Ultra 9系列均搭載鋭炫140V核顯,Xe-cores均為8個,但是頻率略有差異。內存均為芯片集成,分為16GB和32GB兩種規格,均為LPDDR5X 8533MT/s。功耗方面,除了酷睿Ultra 9 288V為30W基礎TDP之外,其余均為17W,而最大TDP均為37W,整體功耗大幅下降。

接下來,讓我們先簡單回顧Lunar Lake的架構特性,同時看看它的實際能效與性能表現究竟如何?

Lunar Lake總體設計目標包含四個大的方向:

其一,擁有突破性的x86處理器能效表現;

其二,出色的核心性能表現;

其三,優異的GPU圖形性能表現;

其四,卓越的AI計算能力。

在這樣的設計目標指引下,Lunar Lake相對於上一代Metoer Lake而言,將較為複雜的分離式模塊化架構設計做了進一步整合。由此前的計算模塊、圖形模塊、SoC模塊、IO模塊整合為計算模塊和平臺控制模塊,另外還包含一個沒有實際功能的填充模塊。同時它還在整個芯片上集成了LPDDR5x內存顆粒,最高支持雙通道32GB容量,這也意味着Lunar Lake平臺筆記本產品將不會設計單獨的主板內存插槽。

·超強能效帶來全平臺功耗降低50%

簡單瞭解架構設計變化之后,我們來看看大家最關心的能效、性能方面的表現。

從英特爾官方公佈的信息來看,Lunar Lake在每瓦性能的提升上着實是下了很大功夫,這使得新平臺總體功耗下降了50%。同時增強和集成了新的電源管理方案,通過全新的供電架構帶來了更好的電源控制,提升了電源利用率。而且內存改用芯片封裝之后,PHY功耗降低了40%,再加上改進后的能效核集羣,Lunar Lake在功耗方面實現了多項關鍵創新。

此外,在Meteor Lake時代,英特爾引入了低功耗到的設計,通過2個超低功耗Crestmont核心承載低功耗應用任務,以降低整個平臺的能耗。Lunar Lake在此基礎上進一步提升了低功耗島的效率,由4個Skymont低功耗核心構成,並且將共享L2緩存提升到了4MB。

這些變化最終反饋到測試端或應用端之后,每瓦性能的提升相對老平臺或同期競品就有了比較顯著的優勢。比如在UL Procyon的Office生產力應用測試中,全新的英特爾酷睿Ultra 9 288V性能比酷睿Ultra 7 165H以及驍龍X1E-80-100高7%,但是封裝功耗則分別下降了53%和49%。相對於驍龍X1E-80-100而言每瓦性能提升1.2倍,相對於酷睿Ultra 7 165H而言提升高達2.29倍!兩代酷睿Ultra處理器的每瓦性能差異着實驚艷。

另外,酷睿Ultra 200V系列集成的全新Xe2架構GPU,也實現了代際間的每瓦性能提升。在《刺客信條:英靈殿》、《賽博朋克2077》以及《模擬農場22》三款遊戲測試中,酷睿Ultra 9 288V對比酷睿Ultra 7 165H,性能分別提升32%、44%以及68%,功耗分別降低35%、22%以及11%,每瓦性能提升顯著。

以往,x86架構處理器的PC設備在整機功耗上往往表現不盡人意,這導致其續航能力備受詬病。雖然酷睿Ultra平臺的出現大幅提升了續航能力,但往往是在較高功耗基礎上通過加大電池容量來實現,這顯然不是移動級處理器芯片技術迭代的初衷。某種程度上來説,Lunar Lake是英特爾酷睿家族中,真正實現整個平臺級功耗大幅度降低的產品。

參考英特爾官方測試數據可以看到,英特爾酷睿Ultra 9 288V對比酷睿Ultra 7 165HUL Procyon Office生產力測試功耗降低50%,MobileMark 30測試功耗降低36%,網頁瀏覽功耗降低34%,Zoom 1*1在線視頻功耗降低45%,Teams、Youtube 4K30 AV1編解碼功耗分別降低41%以及33%。

更低的功耗自然帶來了更長效的續航能力。使用同樣的OEM產品,酷睿Ultra 7 268V平臺對比驍龍X1E-80-100平臺,UL Procyon Office生產力續航時間超出1.7小時,Teams 3*3在線視頻會議少2小時。而酷睿Ultra 9 288V在相同測試項目中,分別可以達到14小時和9.9小時續航能力,相比驍龍X1E-78-100以及AMD鋭龍AI 9 HX 370,續航能力都要高出不少。

因此,全新的Lunar Lake平臺擁有更加極致的能效表現。它實現了全平臺50%的能耗降低,實現了超過2倍的代際每瓦性能提升,實現了20小時的超長續航能力,實現了2倍的GPU能效提升,同時相比競品(驍龍平臺)也有着20%的每瓦性能優勢

·業界最強的CPU單核心性能

Lunar Lake家族全系處理器均採用8核8線程設計,相比上一代酷睿Ultra平臺來説,核心、線程數量都有所下降,因此可能會有用户對其CPU性能表現有所擔憂。不過實際上英特爾通過多種改進設計,彌補了核心/線程數量下降的性能缺口,並且實現了平臺級的能效比升級。那麼英特爾是如何做到這項看起來不太可能完成的任務的呢?

首先,Lunar Lake放棄了超線程設計,並將優化重點放在了性能核上。在關閉超線程之后,Lunar Lake性能功耗比提升15%,性能面積比提升10%,性能功耗面積比提升30%,更優的性能、功耗和麪積比使得無超線程狀態下的性能核有着更好的綜合表現。

其次,全新的低延迟結構設計。在AMD鋭龍AI 300系列發佈之后,核心間延迟暴增且內存延迟仍舊居高不下,這導致一些核心或內存敏感型應用在使用時會有比較明顯的迟滯。而Lunar Lake則依舊保持了低核心延迟特性,同時降低了內存延迟,增強了分支預測能力,並提升了並行處理能力。

根據官方數據來看,Lunar Lake能效核延迟大約在23ns左右,性能核間延迟大約在26ns左右,能效核到性能核間延迟大約為55ns,內存延迟控制在了90ns附近,相比Meteor Lake降低了40%!依舊足夠低的核心延迟,是的Lunar Lake在應用側依舊有更加流暢無迟滯的體驗。

其三,英特爾硬件線程調度器進一步優化。自酷睿平臺使用「大小核」架構設計以來,線程調度就成為影響處理器性能和效率的關鍵因素。Lunar Lake在線程調度方面使用了全新的動態調度策略,並且通過單一能效核的使用來降低平臺功耗,通過其它能效核擴展實現多線程任務高效執行,同時也會根據實際任務負載需求來調度性能更強的性能核。因此,對於輕薄型筆記本來説,Lunar Lake的Lion Cove性能核心有着非常完美的單線程性能表現。參考官方放出的CINEBENCH 2024Geekbench 6.3以及SPECrate 2017整數計算測試,酷睿Ultra 9 288V的單核性能分別高出基準線20%、21%以及61%。相比鋭龍AI 9 HX 370,單核性能分別高出7%,6%以及28%。

而在多線程能效比方面,Lunar Lake也有着相當出色的表現。對比上一代Meteor Lake,Lunar Lake在9W功耗上的8線程性能,比Meteor Lake 14線程性能高22%,每線程性能高2.1倍;在17W功耗上,Lunar Lake 8線程性能比Meteor Lake 22線程性能高10%,每線程性能高出3倍;在23W功耗上,Lunar Lake 8線程性能僅比Meteor Lake 22線程性能低6%,每線程性能高出2.6倍,足見其CPU能效比相對上一代而言提升巨大。

多核性能方面,酷睿Ultra 200V在低功耗區間可以帶來更加出色的性能,但畢竟核心數量有所縮減,峰值性能會略低於競品。不過在各項常規應用的性能層面,比如Handbrake編解碼方面,性能高出基準線92%,同時相比競品也有不同程度的領先。

基於這些提升,Lunar Lake事實上擁有一顆非常快的CPU核心,其能效核代際間IPC提升幅度達到68%性能核IPC提升14%,每線程性能相比前代提升3倍,並且有着更低的核心間延迟核內存延迟,因此為輕薄型筆記本賦予了極其出色的生產力應用體驗。

·鋭炫核顯圖形和媒體性能顯著提升

其實相比CPU而言,筆者個人更加期待Xe2架構的新一代鋭炫核顯的表現。本次酷睿Ultra 200V家族集成了英特爾鋭炫140V和130V兩種不同型號的核顯,前者擁有8個Xe-cores,后者為7個。另外在最大頻率、XMX AI算力方面有所差異,具體可以參考下圖所示:

Lunar Lake引入的全新Xe2GPU,相比Meteor Lake而言,圖形性能提升1.5倍,並且提供了更大的光追單元,幫助提升遊戲的畫質與真實感。

之所以能夠帶來1.5倍的圖形性能升級,主要源於Xe2架構的Xe核心最高增加到了8個,帶來了更強的圖形計算能力。而AI性能的提升來源於Xe矩陣擴展引擎規格的升級,這一全新的矢量引擎支持4096OPS/clock和2048OPS/clock的INT8和FP16計算,並且改進了固定功能單元,提高了吞吐量,從而優化了AI計算效率。其總體AI算力達到了67TOPS,並且擁有8MB L2緩存。

遊戲性能方面,新一代鋭炫核顯的遊戲性能最受期待。根據英特爾官方數據來看,全新的鋭炫140V核顯對比上一代酷睿Ultra 7 155H集成的鋭炫核顯,遊戲幀數平均提升31%;相比驍龍X1E-84-100處理器,除了23款驍龍平臺無法兼容運行的遊戲之外,正常完成測試的遊戲中,平均幀數高出競品68%。另外相對於圖形性能顯著提升的鋭龍AI 300系列的HX 370處理器集成的Radeon 890M來説,鋭炫140V遊戲平均幀數高出16%。

同時,有超過120款遊戲完美支持英特爾XeSS技術,而全新的Xe2XMX內核將實現更高的遊戲幀率。根據官方測試來看,XeSS技術使得代際性能複合提升幅度超過60%。此外,在光追性能、99%低幀、DX12U三項遊戲性能上,鋭炫140V對比Radeon 890M以及驍龍平臺,都有着非常顯著的性能優勢。

圖形性能和能效升級的同時,Xe2 GPU也為Lunar Lake帶來了全新的媒體和顯示引擎。其中,媒體引擎在原有的AV1編解碼上增加了VVC解碼支持,而顯示引擎支持eDP 1.5、DP 2.1、HDMI 2.1接口標準。新的媒體與顯示引擎可以更好地支持自適應分辨率流媒體和360°全景視頻。

VVC解碼是新引擎的一大亮點,雖然目前支持的比較少,但是VVC相對於AV1而言,保證相近質量的同時文件體積減少了10%,這可以幫助視頻流媒體平臺進一步縮減成本,是未來視頻解碼的一大主流方向。

在視頻相關性能方面,Lunar Lake相比上一代最大的優勢無疑是出衆的能效比。以Youtube 4K AV1視頻播放為例,參考下面的GIF圖,左側為Meteor Lake,右側為Lunar Lake,在播放Youtube 4K AV1視頻時,Lunar Lake功耗大多數只有5-7W,而Meteor Lake則基本超過10W。

另外在4K HEVC轉碼1080p AVC\1080p HEVC\1080p AV1三項常見轉碼任務中,鋭炫140V對比競品有着相當顯著的效率優勢。

·全平臺AI算力達到120TOPS

英特爾酷睿Ultra是AI PC時代開啟的標誌,酷睿Ultra 200V作為第二代產品,自然而然的會在AI算力方面實現大幅提升。全新的Lunar Lake處理器確實做到了,其CPU+GPU+NPU算力總計達到120TOPS,其中全新的Xe2GPU架構帶來了67TOPS的峰值AI算力,全新的NPU帶來了48TOPS的峰值算力,再加上5TOPS的CPU AI算力,相對於上一代Meteor Lake提升顯著。

英特爾酷睿Ultra平臺擁有CPU+GPU+NPU三大AI計算引擎,現階段,NPU、GPU、CPU的AI利用佔比分別為25%,40%以及35%。而英特爾預計2025年三大引擎利用佔比將發生一定變化,CPU佔比降低,NPU佔比會提升到30%左右,這意味着NPU對於AI應用的重要性進一步提升。

在上一代產品的比拼中,酷睿Ultra平臺的NPU性能就是最強的,延續到酷睿Ultra 200V系列,其NPU性能隨着算力升級自然實現了進一步突破。現場我們使用UL Procyon的NPU Integer模式測試了酷睿Ultra 9 288V的NPU性能,分數達到了1831分,相比上一代大約提升了4倍左右,性能相當可觀。同時,英特爾官方也給出了相關測試成績,int8性能評分1886,FP16性能評分1017,相比上一代都有非常顯著的提升。

同時UL Procyon的Stable Diffusion 1.5 GPU FP16測試中,鋭炫140V達到了391分,文生圖/圖生圖速度也得到進一步提升。另外對比HX 370的Radeon 890M的182分,鋭炫140V在AI性能方面顯然更加出色。

此外,在Geekbench新加入的AI測試中,酷睿Ultra 9 288V對比HX 370以及驍龍X1E-78-100處理器,CPU、GPU以及NPU三大AI計算核心的性能在int8、FP16、FP32整數和浮點計算中實現全面領先。

實際應用方面,英特爾也給出了一系列測試數據,其中包括AI降噪、Blender OIDN+RT、Topaz、Lightroom、Premiere、AE等各項AI相關測試中,均大幅領先上一代酷睿Ultra 7 155H以及驍龍X1E-78-100平臺。

而在AI生態方面,英特爾從框架到各類大模型的支持都走在業界前列。Llama 3、SDXL、LLaVA等大語言、擴散以及多模態模型的支持,再到英特爾OpenVINO、ONNX、WindowsML等框架的支持都盡善盡美,從而為用户和開發者都提供了足夠值得信賴的AI環境。

基於此,英特爾酷睿Ultra 200V平臺有着交付AI功能方面的行業領先性;有着300余項ISV特性帶來的海量選擇空間;有着更快的AI加速引擎、更多的數據類型支持以及更多的框架幫助用户和開發者更好地使用和開發AI應用,更有着無妥協的兼容性。

·基於軟硬件深度優化的卓越體驗

英特爾酷睿Ultra平臺在提供卓越的計算、圖形、AI性能的同時,也為基於其打造的PC設備帶來了優異的創作、連接、娛樂、學習等多維度體驗。這得益於英特爾45年來持續性的軟件生態發展,它使得酷睿Ultra平臺能夠在系統和編譯、多媒體和性能、函數庫/框架和開發工具包、AI開發以及AI PC應用及生態方面有着全方位軟硬件適配保障,從而使其對x86軟件生態系統具備卓越的兼容性,進而在生產力應用、AI應用等性能層面帶來相比競品更好的表現。

同時,卓越的平臺級體驗也是英特爾一直以來得以領先於業界的殺手鐗。如Wi-Fi7、雷電4、藍牙5.4等特性為平臺帶來卓越的連接性。而英特爾SSE、GSC、CSME以及全新引入的PSE等多重安全引擎從底層硬件層面帶來不同層級的安全性增強。

此外,伴隨着酷睿Ultra 200V系列發佈,英特爾Evo認證規範也迎來新升級。在其規範標準框架內,每款機型設計都需要經過至少12個月的嚴苛測試、驗證,從而在顯示屏光學測試、快速充電測試、音頻測試、連接性測試等諸多方面使其達到英特爾Evo認證規範的要求。

·結語

總體來説,英特爾Lunar Lake對於AI PC行業發展而言有着非凡意義,尤其是本地AI算力的超大幅度提升,很可能會完全改變用户對於AI PC的看法,更加高效、更具安全性的本地化AI體驗將為現代PC用户的生產力效率賦能。

同時,Lunar Lake不僅強在AI,更好的核心性能,更加優異的能效比,以及更為出色的圖形性能,也將推動輕薄型筆記本的再次革命。輕薄便攜但是一天、甚至兩天不插電辦公,在輕薄本上更加流暢地運行3A遊戲,以及用更低功耗干更重負載的任務,這些以往看起來互相矛盾的需求將在Lunar Lake上成為常態。

2024年9月24日起,超過20家OEM廠商的80多款Lunar Lake,即酷睿Ultra 200V新品即將上市,敬請期待!

(8974102)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。