![]()
智東西
編譯 江宇
編輯 李水青
智東西6月19日消息,今日,谷歌DeepMind研究員、Gemini聯(lián)席負責人Noam Shazeer已正式加入OpenAI,將擔任架構研究負責人(Lead for Architecture Research),負責探索新一代AI模型架構,并推動Transformer架構的進一步演進。
Shazeer本人也在海外社交平臺X上發(fā)文官宣加入OpenAI,他說:“我很高興加入OpenAI,并期待與這里卓越的團隊一起工作。”
![]()
與此同時,他也向谷歌團隊表達感謝:“離開是一個艱難的決定。我為谷歌團隊以及我們共同完成的一切感到無比自豪。能夠與你們共事是一種榮幸。”谷歌發(fā)言人則向路透社回應稱,公司感謝Shazeer多年來的重要貢獻,并祝愿他未來一切順利。
Noam Shazeer是AI領域的傳奇人物之一。他是2017年經典論文《Attention Is All You Need》的核心作者之一,該論文首次提出Transformer架構,直接奠定了GPT系列、Gemini、Claude等現代大模型的技術基礎。
![]()
▲《Attention Is All You Need》
在加入OpenAI前,Shazeer曾于2021年離開谷歌創(chuàng)辦Character.AI。Shazeer最廣為人知的身份其實是Character.AI聯(lián)合創(chuàng)始人兼CEO。
這家公司比ChatGPT爆發(fā)還要早一步押注“AI陪伴”賽道,允許用戶與各種AI角色進行長期對話,一度成為全球增長最快的消費級AI應用之一。2023年,Character.AI的估值已突破10億美元(約合人民幣67.65億元)。
2024年,谷歌與Character.AI達成一項價值約27億美元(約合人民幣182.66億元)的技術授權協(xié)議,將Noam Shazeer及部分核心團隊重新招入DeepMind,并任命Noam Shazeer為Gemini聯(lián)席負責人,參與Gemini新一代模型的預訓練研發(fā)工作。
對于正與Anthropic展開激烈競爭的OpenAI而言,這被外界視為近年來最重要的一次頂級人才引進。消息公布后,OpenAI高層和多位知名研究員第一時間在X上留言歡迎。
OpenAI首席研究官Mark Chen發(fā)文稱:“非常高興歡迎Noam Shazeer加入OpenAI,擔任架構研究負責人。他在Transformer、MoE以及高效解碼領域的工作塑造了現代AI。”
![]()
隨后,多位AI研究人員也在評論區(qū)送上祝賀,包括谷歌DeepMind研究員、Gemini Thinking與Coding團隊華人成員Yuchen Zhuang,OpenAI研究員、o系列推理模型核心貢獻者Noam Brown,以及前微軟AI副總裁、現OpenAI研究員Sebastien Bubeck等。
![]()
▲谷歌DeepMind華人研究員Yuchen Zhuang
![]()
▲OpenAI o系列推理模型核心貢獻者Noam Brown
![]()
▲OpenAI研究員Sebastien Bubeck
與此同時,也有網友感嘆:“失去一位Transformer作者和Gemini聯(lián)席負責人,對谷歌來說無疑是一次沉重打擊。”
![]()
一、知名Transformer作者,在谷歌工作近18年
如果從生成式AI的發(fā)展史來看,Noam Shazeer幾乎參與了每一個關鍵節(jié)點。他于2000年加入谷歌,先后擔任軟件工程師和首席軟件工程師,累計工作超過18年。
![]()
▲Noam Shazeer工作經歷與教育經歷(圖源:領英)
2017年,他與Ashish Vaswani、Jakob Uszkoreit等8位谷歌研究員共同發(fā)表經典論文《Attention Is All You Need》,提出Transformer架構。相比此前主流的RNN和LSTM模型,Transformer能夠更高效地處理長文本,并具備更強的擴展能力。
過去幾年,無論是OpenAI的GPT系列、谷歌Gemini、Anthropic Claude,還是DeepSeek、Llama等模型,底層幾乎都建立在Transformer架構之上。換句話說,今天這場席卷全球的大模型浪潮,很大程度上都建立在這篇論文奠定的技術基礎之上。
不過,Transformer只是Noam Shazeer眾多代表作中的一個。
在谷歌任職期間,他還參與推動了多項影響深遠的大模型技術。2017年,他作為第一作者提出稀疏門控混合專家(MoE)架構,為后來的GPT-4、Gemini、DeepSeek-V3等模型提供了重要技術思路;2018年,他又參與開發(fā)Mesh TensorFlow,為超大規(guī)模Transformer訓練提供基礎工具;此后,他還參與T5模型以及谷歌對話模型LaMDA等多個關鍵項目研發(fā)。
二、從谷歌離職創(chuàng)業(yè),又被182億買回
2021年,Shazeer離開谷歌,與Daniel De Freitas共同創(chuàng)辦Character.AI。
當時,大語言模型尚未迎來ChatGPT時刻,但Character.AI已經率先嘗試將聊天機器人產品推向大眾市場,并迅速積累大量用戶。
2024年,谷歌以約27億美元(約合人民幣182.66億元)的合作交易重新將Shazeer及其核心團隊納入DeepMind體系。隨后,他成為Gemini項目的重要負責人之一,并參與Gemini新一代模型的預訓練工作。
Shazeer回歸的時間點,正值谷歌AI業(yè)務承受巨大壓力。彼時ChatGPT爆火,Gemini仍處于追趕階段。重返DeepMind后,Shazeer參與模型研發(fā),并最終出任Gemini聯(lián)席負責人,成為谷歌AI技術領軍人物之一。
此后,Gemini 3系列模型在編程、推理等多個基準測試中躋身行業(yè)前列,成為谷歌與OpenAI、Anthropic競爭的重要籌碼。
從谷歌研究員,到創(chuàng)業(yè)者,再到Gemini聯(lián)席負責人,Shazeer幾乎見證了谷歌近十年來AI發(fā)展的每一次重要轉折。因此,此次離開谷歌加入OpenAI,也被不少業(yè)內人士視為谷歌近年來最重要的人才流失事件之一。
三、OpenAI的人才爭奪戰(zhàn)還在升級
Shazeer加盟的背景,是AI行業(yè)愈發(fā)激烈的人才競爭。
過去一年里,OpenAI與Anthropic之間的競爭持續(xù)升溫。雙方不僅圍繞模型能力展開較量,也在不斷爭奪頂級研究員和核心工程師。
英國《金融時報》報道稱,OpenAI內部將Shazeer的加入視為一次重要補強。未來他將重點研究Transformer之后的新架構方向,以及如何進一步提升模型能力。
值得注意的是,Transformer已經統(tǒng)治AI領域近十年。隨著推理模型、多智能體系統(tǒng)以及世界模型的發(fā)展,越來越多研究人員開始思考:Transformer是否會迎來下一次重大架構升級?
而Shazeer恰恰是最有資格回答這個問題的人之一。
對于谷歌而言,這意味著失去了一位Transformer作者、Gemini聯(lián)席負責人以及最資深的AI架構設計者之一。對于OpenAI而言,其實驗室則迎來了一位曾親手塑造現代AI技術棧的人。
結語:Transformer時代的重要人才流動
隨著技術逐漸逼近前沿,頂級研究員本身也成為最稀缺的資源之一。Noam Shazeer的職業(yè)軌跡,幾乎串聯(lián)起了Transformer、Character.AI、Gemini和OpenAI四個重要節(jié)點。
如今,這位Transformer作者離開谷歌、加入OpenAI,既是一場人才流動,也折射出當下AI巨頭之間愈發(fā)激烈的競爭態(tài)勢。
尤其是在OpenAI與Anthropic圍繞下一代模型、企業(yè)市場和頂級研究人才展開白熱化競爭的當下,谷歌也正通過Gemini持續(xù)追趕。此時失去一位Transformer奠基人和Gemini聯(lián)席負責人,對谷歌而言無疑是一筆不小的損失。
對于整個行業(yè)來說,后續(xù)值得關注的問題或許是:當Transformer作者親自研究“Transformer之后的架構”時,下一代AI模型會走向何方。
來源:The Information、Noam Shazeer
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.