繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

ResNet作者張祥雨,投身AI大模型

2024-08-05 13:22

衡宇 西風 發自 凹非寺

量子位 | 公眾號 QbitAI

大模型的人才黑洞效應,還在持續。

量子位獲悉,最新出現在大模型大牛轉會名單上的重磅大牛,是90后AI大牛張祥雨,ResNet四位作者之一,孫劍首位深度學習博士生,未來科學大獎得主。

現在,他出現在了國產大模型獨角獸階躍星辰的引援傳聞中。

而且六小強之一的階躍星辰,據說最近還不止這一位AI大牛。

不過截至發稿,階躍星辰暫未作出明確迴應。

張祥雨,ResNet四位作者之一

△圖源:未來科技大獎官網 △圖源:未來科技大獎官網

2008年,張祥雨考入西安交通大學;一年后申請轉專業進入軟件工程專業學習。

2011年,張祥雨獲美國大學生數學建模競賽(MCM)特等獎提名獎(Finalist),創下當時西安交通大學參加該競賽以來歷史最好成績。

2012年,張祥雨獲西安交通大學軟件學院軟件工程專業學士學位。

之后張祥雨又入選了西安交通大學與微軟亞洲研究院博士生聯合培養項目,師從孫劍和何愷明。2017年,獲得博士學位。

正是在微軟亞洲研究院期間,何愷明、孫劍、任少卿和張祥雨四人共同完成了著名的ResNet,張祥雨負責底層框架和編碼。

ResNet即殘差學習,本身雖為計算機視覺領域研究,但其核心思想殘差連接已經跨界成為現代深度學習模型的基本組件。

開啟上一次AI熱潮的AlphaGo Zero就是結合了ResNet+強化學習+蒙特卡洛搜索共同完成。

而開啟最新AI熱潮的ChatGPT,其中的「T」也就是Transformer網絡中同樣使用了殘差連接。

ResNet原始論文在2016就獲得了CVPR最佳論文獎。

去年,何愷明、孫劍、任少卿和張祥雨四人又憑藉這項研究獲得了2023未來科學大獎「數學與計算機科學獎」,由此可見其深遠影響。

目前這篇論文Google Scholar的被引用次數已超23萬,是本世紀最火的深度學習論文之一:

2016年7月,孫劍加入曠視,任首席科學家和曠視研究院負責人。張祥雨在博士畢業后也緊隨導師進入了曠視

張祥雨研究方向包括高性能卷積網絡設計、AutoML與自動化神經網絡架構搜索、深度模型的裁剪與加速。

2017、18年,張祥雨完成了另一代表作——移動端高效卷積神經網絡ShuffleNet兩部曲。

現月之暗面聯合創始人、算法團隊負責人周昕宇,也是共同一作。

ShuffleNet后來影響了包括蘋果3D人臉解鎖在內的各種手機毫秒級人臉解鎖技術。

2020年,張祥雨入選「AI 2000計算機視覺全球最具影響力學者」榜單第4位。

除此之外,張祥雨還有諸多研究,Google Scholar數據顯示,目前其論文引用量達到320510次,h-index為59。

還有2位萬引大牛加盟

2024年,AI牛人的流動沒有減少,但他們的選擇不全是下場創業。

行業中人往往對AI技術有很強烈的親身感受。他們中還有許多像張祥雨這樣,選擇前往既有公司,到新潮流一線激情衝浪的人。

而階躍星辰,就在悄然之間招攬了不少這種選擇的牛人。

量子位獲悉,除了張祥雨,騰訊俞剛和MSRA段楠,也已經加入階躍星辰的隊伍。

俞剛,現任階躍星辰首席科學家

在此之前,他在騰訊擔任研究總監;再之前,他是曠視Detection組長。

俞剛2007年本科畢業於山東大學,2010年在上海交通大學獲得計算機碩士學位。

之后前往南洋理工大學攻讀博士學位,師從袁浚菘;期間曾在微軟研究院實習,2014年畢業后加入曠視工作。

主要負責檢測、分割、跟蹤、骨架、動作行為等方面的研究以及算法落地工作。

2017年,俞剛帶隊參加2017 COCO+Places挑戰賽,獲得檢測第一名,人體姿態估計第一名;2018年再次帶隊參加COCO+Mapillary挑戰賽,獲四項第一。

曠視五年期間,俞剛和曠視首席科學家、曠視研究院院長孫劍合著過十篇paper。

2019年年底,俞剛在知乎確認離職消息,宣佈加入騰訊PCG光影研究室,繼續從事CV相關算法及技術研究。

今年,俞剛有2篇論文被ECCV2024接收、2篇論文被CVPR接收;同時,他也擔任了CVPR的區域主席。

目前,俞剛的谷歌學術被引量為1.9萬。

再來説MSRA段楠——其實今年5月,量子位就跟大家分享過他加入階躍星辰的訊息。

離職前,段楠是MSRA資深首席研究員,自然語言計算團隊研究經理。

主要從事自然語言處理、多模態智能、代碼智能、機器推理等研究,多次擔任NLP/AI學術會議程序主席和領域主席。

同時是中國科學技術大學、西安交通大學兼職博導,天津大學兼職教授。

段楠從天津大學博士畢業后就加入MSRA,當今NLP領域成就最高的華人之一、MSRA前副院長周明是他的導師。

他在MSRA工作了17年零9個月。

工作期間,段楠的多項研究成果成功應用到微軟AI產品中,包括必應搜索、必應廣告、微軟新聞、Cortana語音助手和微軟小冰等。

他的研究工作還有微軟NüWA(女媧),由MSRA和北大聯合打造的多模態預訓練模型,面世則直取8項SOTA。

據瞭解,段楠擔責的職務是NüWA系列模型家族項目擔任研究組長和導師。

目前,段楠的Google Scholar被引量,也逼近1.9萬。

另有統計結果顯示,段楠與微軟前全球副總裁、階躍星辰創始人CEO姜大昕,合著過44篇論文。

大模型創業,AI人才新黑洞

幾個月時間,把張祥雨、俞剛、段楠收入囊中,還有更多的AI人才加入消息祕而不宣。

階躍星辰必然是有兩把刷子在身上的。

究其原因,首先是其頗受認可的江湖地位

階躍星辰已經是公認的國產大模型創企「六小強」之一:

和月之暗面、Minimax、智譜華章、零一萬物、百川智能一起,深耕基礎模型領域,並因人才、技術、產品、市場認可度綜合評價,估值快速躍遷至10億美金以上。

6月時,階躍星辰在投融資市場中的身價,曝已是20億美元。

再就是出場就很吸引人的人才堡壘

創始人兼CEO姜大昕,微軟前全球副總裁。

不談其他,單純看他在微軟的最后title,就很能理解為什麼許多與MSRA有千絲萬縷聯繫的AI牛人門,前赴后繼奔向階躍星辰懷抱中(一個狗頭)

2011年,姜大昕開始在微軟亞洲互聯網工程院(STCA)工作,去年3月升任爲微軟副總裁,同時兼任亞洲軟件技術中心WebXT S+D(網絡體驗、搜索和分銷)集團總經理。

然后在事業新高峰時依然下場創業,有了今日的階躍星辰。

階躍星辰的數據負責人焦斌星,就是和姜大昕一起打包自己,從微軟投身AI新浪潮創業的一份子。

這家公司的系統負責人朱亦博,也曾有過MSRA的工作經歷。

更重要的是,他是國內屈指可數的、擁有多次單集羣萬卡以上的系統建設與管理實踐經驗的從業者。

以及離不開的壘雪球神器——階躍自研模型和產品。

其模型側的Step系列通用大模型,以及躍問&冒泡鴨兩款toC產品,陸陸續續投入市場,進行檢驗,正在獲得更大的認可。

以上或許能解釋,為什麼階躍星辰成爲了我們看到的「AI人才黑洞」。

而階躍星辰對人才的吸引力,正是大模型六小強瘋狂「斂(人)才」的原因的縮影。

人才的流動,還會繼續。

參考資料:

[1]https://se.xjtu.edu.cn/info/1044/2628.htm

[2]https://www.skicyyu.org/

[3]https://scholar.google.com.sg/citations?user=BJdigYsAAAAJ&hl=en

[4]https://nanduan.github.io/

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。