阿里林俊暘離職風波深度解讀:大模型時代,Infra 困局背後的"AI-Native"組織之爭
📖 導讀
近日,阿里通義千問(Qwen)大模型技術負責人林俊暘離職的訊息在整個科技圈引發熱議。據悉,這位大模型頂尖人才的離開,不僅是個人職業的選擇,更深刻反映了阿里等傳統網際網路大廠在通往 "AI-Native(AI原生)" 組織轉型過程中,演算法與基礎設施(Infra)之間難以調和的結構性矛盾。
Toolswith.ai 編輯部透過訪談多位業界人士及多方渠道獲悉,這場變動的核心誘因之一,是林俊暘對"自建 Infra 團隊"以追求極致迭代效率的堅持,與阿里現有組織架構之間的直接衝突。在大模型競賽進入白熱化的今天,當"演算法等排期"成為常態,甚至自家 Infra 效能不及競對開源框架時,關於"AI 原生組織"定義的結構性博弈終於走到了爆發點。本文將透過現象看本質,為您帶來深度的 AI 原生層面思考。
一、 核心人物離職,引爆 Infra "深層矛盾"
作為通義千問大模型研發的靈魂人物,林俊暘的離職在圈內引發了巨大震動。據內部知情人士透露,林俊暘此前曾極力推動在 Qwen 團隊內部建立第三方的 Infra(基礎設施)團隊。為了確保模型迭代的極致速度,他甚至已經超前儲備了一批相關方向的技術人才。
據《晚點 LatePost》報道,Qwen 模型團隊從去年中開始嘗試組建自己的 Infra 團隊。此前,這部分工作主要由阿里雲的人工智慧平臺 PAI 負責,而 PAI 需同時支撐來自通義實驗室不同團隊的多元化 Infra 需求。然而,這一旨在實現 "演算法、工程一體化" 的提議最終未能獲得阿里高層的批准。林俊暘的離職,被外界解讀為技術理想主義與大廠傳統組織架構之間的一次激烈碰撞。
二、 慢半拍的"排期":被扼殺的迭代速度
在基座大模型的競賽中,速度就是生命。然而,阿里當前的組織架構卻在無形中成為了 Qwen 加速的"阻力"。
據接近 Qwen 團隊的人士爆料,目前的研發流程顯得較為臃腫:演算法同學在進行模型改進時,必須依賴於獨立的 Infra 部門(如 PAI 平臺團隊)提供工程支援。這意味著,演算法端一個簡單的改進測試,往往需要先向 Infra 團隊提需求、走流程,再等待對方的"排期"。這種模式深植於阿里的傳統網際網路架構中——阿里曾在中國網際網路界率先推崇"大中臺"概念,但在大模型時代,這種強調跨部門複用、資源統一排程且伴隨複雜協調成本的中臺思維,顯然已無法適應大模型毫秒必爭的迭代節奏。
"一個本該在幾天內完成的迭代實驗,往往因為跨部門協作和排期問題,拖上數週甚至更久。"
這種演算法與工程的高度分離,導致 Qwen 在快速演進的全球大模型競賽中,難以發揮出應有的靈活性與爆發力。
三、 遭"友商"降維打擊:VeRL 事件背後的尷尬
更令內部感到沉重的是技術底座的實戰差距。據悉,在 Qwen 模型的後訓練(Post-training)階段,由於阿里 PAI 團隊提供的 Infra 架構存在諸多潛在問題,導致模型效果一度無法達到預期。
令人尷尬的是,林俊暘團隊在嘗試使用位元組跳動開源的強化學習框架 VeRL 後,模型效果立竿見影地得到了提升。自家平臺的工程底座在核心效能上不如競爭對手的開源工具,這一事實不僅刺痛了技術團隊的自尊,更赤裸裸地暴露了阿里目前"演算法與工程割裂"的組織缺陷。
四、 全球共識:當"研究"與"工程"的藩籬逐漸消失
林俊暘對 Infra 獨立性的執著,並非孤立的技術理想主義,而是正成為全球頂級 AI 實驗室的共識:在大模型時代,演算法與工程正迅速融為一體。
1. OpenAI 翁家翌:Infra 決定了公司的"生死線"
OpenAI核心成員翁家翌在近期的訪談中表達了極其硬核的工程觀點。在他眼中,Infra 的地位幾乎等同於大模型公司的"生死線"。
- "Infra 即命門":他反覆強調一個核心邏輯——每家公司的 Infra 都有 Bug,誰修復的 Bug 越多,模型就能訓練得越好。
- 規模化瓶頸並非算力:真正的瓶頸在於"還沒把現有路線榨乾"以及"Infra 仍存在大量 Bug"。誰能提升修 Infra Bug 的吞吐量,誰就能獲得更快的正確迭代速度。
- Idea 很便宜,驗證很貴:Idea 本身並不稀缺,核心競爭力在於"驗證密度"——即單位時間內能驗證多少個想法。而決定驗證密度的,正是 Infra 是否足夠正確、迭代是否足夠快。
- 工程能力的培養更困難:他認為教一個研究員(Researcher)做好工程(Engineering),遠比教一個工程師做好研究(Research)難得多。
2. Anthropic:崛起的"研究工程師"與反超之路
Anthropic 的崛起是其"研究工程師(Research Engineer)"人才戰略的最強註腳。在其招聘說明中,有一句極具代表性的話:"在這裡,工程師做大量的研究,而研究員則承擔大量的工程。(One thing worth knowing: engineers here do lots of research, and researchers do lots of engineering)"
- 全棧職責與閉環迭代:崗位要求人才能夠貢獻於整個技術棧,從底層的低階最佳化到高層的模型設計。核心職責明確指向對訓練基礎設施(Infra)的持續最佳化與擴充套件。
- 極致速度下的全方位引領:正是依靠這種超高的迭代效率,Claude 系列模型實現了高速進化,甚至反超 OpenAI 的 GPT,登頂目前能力最強的大模型之位。同時,Anthropic 在 Agent(智慧體)、Safety(AI安全)等前沿領域也引領了全球潮流。
▲ Anthropic 官網 Research Engineer 招聘頁面,明確要求"貢獻於整個技術棧,從底層最佳化到高層模型設計"
3. xAI:徹底消滅"學術古董"術語
埃隆·馬斯克(Elon Musk)在 xAI 採取了更為激進的組織實驗,直接廢除"研究員"與"工程師"的層級劃分:
- 拒絕雙層體系:馬斯克認為,將人才區分為"研究員"和"工程師"本質上是對低效雙層工程體系的一種隱晦描述。
- 唯一稱謂:他直言"研究員(Researcher)"是學術界的古董術語,在 xAI "這裡只有工程師(Engineer)"。這種極致的扁平化確保了演算法改進能第一時間轉化為工程實現。
▲ 馬斯克在 X 上宣佈:xAI 廢除"研究員"稱謂,"這裡只有工程師"
雖然言論極具爭議,但正是這種高度整合,讓 xAI 能以驚人的速度搭建起萬卡叢集。作為後起之秀,Grok 大模型得以迅速躋身全球頂尖梯隊。
結語:阿里離"AI-Native"組織還有多遠?
林俊暘的離開,折射出傳統大廠在大模型時代組織認知上的滯後。當矽谷巨頭紛紛將"演算法、工程、Infra"擰成一股繩,以追求極致的"驗證密度"時,國內大廠若依然困於"中臺思維"或"跨部門排期",即便是最頂尖的演算法人才,也將面臨"巧婦難為無米之炊"的困局。
通義千問若要真正登頂,阿里或許首先要手術的不是模型程式碼,而是對AI-Native組織更多深度的思考與重構。
📚 參考資料與引用
- [晚點 LatePost] 阿里Qwen人事變動:誤讀、近況、伏筆和未來
- [走進翁家翌] OpenAI,GPT,強化學習,Infra,後訓練(Youtube連結:https://www.youtube.com/watch?v=I0DrcsDf3Os Spotify連結:https://open.spotify.com/episode/3WJoXs2hq06lV93sLSG461)
版權宣告:本文由 Toolswith.ai 編輯部深度策劃及撰寫。未經授權,嚴禁轉載或映象,違者必究。