熱門資訊> 正文
2025-02-05 10:07
Thomas Luo|Co-founder and CEO, GenAI Assembling
Roman Chernin | Co-founder and CBO, Nebius
Nebius(NASDAQ: NBIS)是總部位於荷蘭阿姆斯特丹的全棧AI原生雲平臺領導者,提供大規模GPU集羣和專為AI與機器學習高強度工作負載優化的基礎設施。2024年12月,公司完成了由Nvidia和Accel領投的高達7億美元戰略股權融資,並獲得超額認購。
在GenAI Assembling算力主題活動的第二場爐邊對話中,Nebius聯合創始人兼CBO Roman Chernin來到現場,與觀眾分享了他對於GPU市場策略、基礎設施如何適應后預訓練時代、以及Nebius未來佈局的關鍵看法。
隨着近期DeepSeek等高效模型的出現,業界對算力需求的爭論愈發激烈。Nebius作為這一背景下的核心參與者,其視角也讓這場討論顯得尤為重要。
以下為對話實錄:
Thomas Luo:今天我們要與Nebius的Co-founder兼首席商務官Roman對話。Roman,很高興邀請到你,這次美國之行感覺如何?
Roman Chernin:一如既往地緊湊。這次我幾乎沒怎麼睡,部分是因為時差,部分是實在沒時間睡覺。自從去年11月底以來一切都在快速發展—比如H100 GPU的價格已顯著下跌。其實我在過去五天內參加了大約50場會議,每場都很有意思。
Thomas Luo:在我們正式開始之前,能否先向觀眾介紹一下Nebius的背景?當我描述Nebius時覺得有點難,它像是一個既古老又年輕的創業公司,還在納斯達克上市了。你能分享一下它的故事,特別是從Yandex轉變的那部分嗎?
Roman Chernin:當然。在座誰知道Yandex?誰在今天以前聽過Nebius?——看來后者少得多哈哈,我們在提升知名度方面還有很多工作要做。
這是一個獨特且相當不尋常的故事。有些人可能知道,Yandex常被稱為"俄羅斯的谷歌",但這種説法其實不全面。它其實更像是俄羅斯的谷歌、優步、Spotify和Netflix的集合體—一個與俄羅斯互聯網密不可分的公司。
我剛開始負責系統管理時,Yandex無處不在。這是一家擁有尖端技術和高質量人才的出色公司。我在那兒工作了十多年,先后領導搜索、中小企業服務和地理服務部門。在此期間,我們一直懷揣着國際化擴張的雄心。我們相信不論在哪兒,Yandex都能證明偉大的事物是可以被創造的。
但在2022年2月危機爆發時,即便是最樂觀的人也意識到局勢將發生鉅變。我們中許多人對衝突深感擔憂,難以相信這實際發生了。也因此公司開始變化—首先是人員。員工和創始人面臨艱難抉擇:是留在原地還是另尋他處。這一過程漫長而複雜,就像Netflix劇集一樣。從2022年2月到2024年7月,歷時兩年半。到那時,我們已完成原有資產的調整,讓公司全面轉型。
以前,Yandex是一家註冊在荷蘭、估值350億美元的納斯達克上市公司,擁有2萬名員工。當轉型最終完成時,停擺兩年半的納斯達克交易得以恢復。而在此期間,持有Yandex股票的投資者看到他們的持股被凍結。當我們終於在2024年10月完成分離時,納斯達克在某個周三通知我們下周一將恢復交易。那時我們正在進行融資,於是不得不告訴潛在投資者:"抱歉,但現在你們是在投資一家上市公司。"
這不是首次公開募股,而是重新上市,這在公開市場歷史上從未發生過。Yandex的股東最初投資的是一家俄羅斯互聯網公司,但現在我們是一家專注於完全不同市場的非俄羅斯、非互聯網公司。幸運的是,市場反應積極。我們在12月完成了融資,由Accel Ventures領投,Nvidia作為戰略投資者加入。所以現在我們在這里。我常把我們描述為一家身穿上市公司外衣的B輪創業公司。
Thomas Luo:聽起來很不可思議。從我的角度來看,這個故事最引人注目的地方之一是,在這兩年半時間里,你們成功保留了核心工程團隊和管理團隊,據我所知,你relocated到了以色列,其他人則遷往荷蘭、美國或其他地方。同時,你們還在全球積極招募人才。
你們公司正在建立真正的全球化佈局—你們在美國聘請了新的CMO,其他產品和工程崗位也在歐美各地落實。感覺Nebius已經在以一個完全全球化的公司模式運營。
我有兩個問題:首先,Nebius是如何做到這一點的?其次,為什麼你們決定將GPU雲服務作為從Yandex分離並建立新身份的關鍵領域?
Roman Chernin:回答你的問題,在2022年和2023年,我們專注的主要項目不是產品或市場,而是relocating 1300個家庭。我們的首要任務是幫助他們安頓下來,重啟生活。當我們開始這個過程時,並沒有明確的公司發展計劃。但我們知道我們擁有一項獨特的資產:世界級的工程人才。
這些人此前已經建立過hyperscaler(超大規模服務提供商),知道如何高效且有效地進行規模化運營。我們意識到,即使我們沒有資金、數據中心或業務,這些人才是我們最寶貴的資產。我們知道可以圍繞這個核心建立新的事業。
然而,俄羅斯人普遍不擅長銷售。雖然我們擁有卓越的工程人才,但要將其轉化為成功的業務和優秀的產品需要不同的技能組合。我們專注於通過在全球招募業務開發、銷售和產品管理等領域的最佳人才來補充我們的工程優勢。
我們所在的GPU雲服務業務,其客户和人才自然高度集中在美國。因此,建立強大的美國業務成為重中之重。我現在的職責是在這里建立一個世界級的團隊,這個團隊既要人才出衆,又能吸引更多頂尖人才加入。我們正在全力實現這一目標。
當我們最初開始建立美國業務時並不容易。許多人持懷疑態度—為什麼一羣總部在荷蘭的俄羅斯人想要建立全球化業務?幸運的是,一些具有遠見的勇敢者願意給我們機會,隨着時間推移,事情變得越來越容易。每周、每月,越來越多的人理解我們是誰、在做什麼。現在,當新的人才加入時,他們面對的是來自不同背景的團隊—不僅僅是像我這樣帶着濃重口音的俄羅斯人。這真正在成為一家全球化公司,這就是我們的發展方向。
Thomas Luo:很有意思。那麼,為什麼選擇GPU?
Roman Chernin:這其實不僅僅關於GPU—而是關於AI。Yandex一直是一家AI驅動的公司。我們開發深度技術和智能驅動的產品,搜索業務也一直處於機器學習和AI的前沿。所以當我們創立Nebius時,我們知道要圍繞AI來建設。
我們也很早就意識到不會成為面向消費者的B2C公司。相反,我們決定為開發者創造產品。我們的想法是,在Yandex積累的專業知識—構建hyperscaler和大規模系統—可以幫助我們服務其他工程師和開發者。我們將自己定位為一家"技術公司"或面向技術人員的公司。
我們的獨特之處在於擁有罕見的專業知識組合。我們有知道如何建設物理基礎設施的人才,比如高效的數據中心;有設計和構建硬件的專家;還有出色的軟件工程師—大多數團隊都有軟件背景。
當我們看到計算能力需求的增長和AI的快速發展時,我們意識到我們的人才和資產自然而然地讓我們適合進入這個市場。我們別無選擇—這是最合理的前進方向。
但提供GPU算力並不是我們的全部長期願景。我們的使命是為那些創造突破性AI產品的開發者和研究人員構建卓越的AI基礎設施。這是我們的核心焦點。
Thomas Luo:你很好地指出了前Yandex團隊—現在的Nebius團隊—在業務擴展方面的專長。這就像你們在俄羅斯是全能型選手。你們的核心優勢之一似乎是擴展業務和運營。正如你提到的,你們的使命是支持AI從業者、研究人員和開發者構建和擴展他們的AI產品。你是否認為加速這些產品的擴展過程也是你們使命的一部分?
Roman Chernin:是的,但這不是關於一般意義上的業務擴展—不同業務有不同需求。我們專注於構建可擴展的技術平臺。這是關於創建能夠高效運營並有效服務客户的基礎設施。這是我們正在建設的核心。
Thomas Luo:好的,詳細説説你們在美國市場的策略。
Roman Chernin:我們專注美國的主要原因是市場在這里。我們跟隨需求。我們在美國做的是擴展基礎設施。我們已經啟動了第一個數據中心,很快就會啟動第二個和第三個。今年我們的大部分部署都集中在美國。
首要任務是擴展基礎設施。其次是直接與客户合作—不僅是銷售,還包括建立客户成功和服務團隊,確保客户成功。另一個我們正在解決的挑戰是知名度不足。幾個月前,沒人聽説過我們。但現在,GPU雲業務的專業人士開始認識我們,客户羣體中的認知度也在提升。這是一個漸進的過程,但這里的團隊做得很出色。我相信我們正在正確的軌道上,將在這個市場上變得更加顯眼並站穩腳跟。
Thomas Luo:但你們如何與CoreWeave等這個領域的老牌企業競爭?他們也得到了Nvidia的支持。有Nvidia作為投資者並不代表一定能保證成功,對嗎?
Roman Chernin:當然不能。在以色列,我們稱之為"kosher stamp"—這只是一個認可的標誌,而非成功的保證。要"真正成功"需要建立業務。
在我們融資路演時,我們強調了三個核心信念:
首先,計算需求會持續增長。對此有兩種理論:一種將計算比作早期互聯網時代的光纖—基礎設施最終會達到平穩;另一種將計算比作能源—在人類歷史的每個階段,人們都會消耗所能生產的所有能源。我們贊同后者。計算能力越多,我們創造的產品就越先進,導致更廣泛的應用和持續增長的計算需求。
其次,我們相信市場將長期保持競爭性。雖然谷歌、微軟和OpenAI等大玩家擁有近乎無限的資源優勢,但開源的力量和新玩家在細分領域的涌現讓我們相信競爭會持續。競爭市場不僅有利於商業,也有利於人類。如果AI領域被壟斷,將對創新和整個社會構成重大風險。
第三,在這些條件下,我們問自己:作為Nebius,我們是否有權利成功併成為重要玩家?我們的答案是肯定的。我們相信我們獨特的資產和能力組合讓我們具備優勢。
為什麼?因為建立成功的基礎設施需要技術和資本的結合。這是一個高度資本密集型業務—部署新基礎設施需要數十億資金。得益於我們的轉型過程和現在是上市公司的事實,我們很幸運擁有充足的財務資源。我們還擁有有價值的資產,比如在Peakhouse的重要股份,我們認為它具有巨大潛力。
除了資本,你還需要技術。這不是一個簡單地購買硬件、部署它就能開始賺錢的業務。它要複雜得多。例如,計算價格下降實際上對我們有利,因為我們有信心能比市場上許多玩家運營得更有效率。
我們的優勢在於資本、人才和技術專長的結合。與其他新興雲服務提供商不同,我們大量投資軟件開發,構建強大的平臺而不是僅提供物理基礎設施。這種方法使我們與衆不同,併爲長期成功奠定基礎。
Thomas Luo:有種觀點認為在預訓練后時代,GPU變得不那麼重要了。這也是價格下跌的原因之一。你同意這個觀點嗎?
Roman Chernin:我不這麼認為。我認為價格下跌更多是因為Nvidia解決了供應鏈問題。此外,這種下降是由市場動態驅動的—客户對承諾變得更謹慎和理性,許多人避開舊一代GPU轉而選擇新一代。這是一種經濟趨勢,而不是需求減少的反映。
從在建數據中心的規模來看,計算需求顯然沒有放緩。實際上,我認為我們正在進入一個令人着迷的階段,重點從產品開發轉向產品應用。
訓練是關於創造產品,但真正的成功來自於人們開始使用它—這就是推理變得關鍵的地方。舉個例子,我們與開發視頻模型的Luma Labs合作。在去年夏天他們取得巨大成功的發佈之前,大約90%的算力用於訓練,只有10%用於推理,因為他們仍在構建模型,使用量很小。但在他們推出廣受歡迎的"Dream Machine"版本后,兩周內總計算需求增加了5-7倍,推理佔用了80%的算力。這種轉變發生是因為他們的產品從開發階段轉向了實際應用。
我們仍處於AI產品應用的早期階段,但隨着使用量增長,我們將看到計算需求的大幅增加。使用將推動對更多GPU的需求—不是爲了訓練,而是爲了推理。場景正在演變,我們將看到更全面的系統融入商業、日常生活等領域。關於市場對算力的需求我並不擔心。
Thomas Luo:讓我們談談端側AI。在之前的討論中,提到了計算能力從雲端向端側的轉移。你如何看待這一趨勢對GPU雲服務的當前基礎設施、定價模式或商業模式的影響?從歷史上看,GPU服務提供商—有時被稱為GPU農場—建立大型集羣並直接向開發者提供算力。這種模式會演變嗎?
Roman Chernin:我認為這種演變很自然。即使在GPU時代之前,我們就看到移動設備變得越來越先進,計算能力越來越強。但儘管如此,雲計算需求仍在增長,因為隨着設備能力的提升,應用的複雜性也在提高。
我相信端側AI也會出現類似模式。確實許多應用會在設備上運行,但這不會完全取代雲計算。相反,我們需要一種新型基礎設施—我稱之為邊緣雲。可以將其視為CDN(內容分發網絡)之后的下一步。
我們需要高度分佈式的計算基礎設施來處理低延迟場景,確保資源靠近終端用户。實時視頻、交互式遊戲和其他對延迟敏感的應用將需要靠近客户的基礎設施。然而,這並不意味着端側會取代雲;更多是關於用例的日益複雜和多樣化。每種場景都需要其量身定製的基礎設施,邊緣和雲將共存以支持這種複雜性。
Thomas Luo:現在想提問前最后一個問題。從更長遠來看,你如何看待模型性能和計算需求之間關係的演變?這包括大語言模型、小型模型和更復雜的AI應用或代理。這種演變可能如何影響GPU服務市場?
Roman Chernin:我認為在未來五年左右,我們將看到專門針對特定用例設計的專用硬件取得重大進展。模型將變得更加多樣化—不僅是規模,還包括類型和功能。
目前,許多工作負載在現有硬件上的優化都很差。我們依賴少數標準芯片設計,這與日益增長的工作負載種類並不完全匹配。未來,我預計會看到硬件更專業化,這將導致生態系統不同層面的競爭加劇。
雲基礎設施日益增加的複雜性將需要供應商之間更多的協作,以及採用更多樣化的解決方案。這是我們如此堅信投資平臺的原因之一。如果市場保持像今天這樣簡單—標準GPU和參考設計集羣—Nvidia可以通過構建所有必要的軟件輕松主導。但如果未來涉及更復雜和多樣化的生態系統,產品和用例差異顯著,那麼靈活、強大的平臺的價值將不容否認。
這就是為什麼我們專注於創建一個能適應這種複雜性的平臺,為客户提供在更具競爭性和專業化環境中蓬勃發展所需的工具和效率。
點個「愛心」,再走 吧