Andrej Karpathy 加入 Anthropic,打造以 AI 加速預訓練的研究新團隊
OpenAI 共同創辦人、前特斯拉 AI 總監 Andrej Karpathy 正式宣布加入 Anthropic,將帶領一支全新團隊,利用 Claude 本身來加速預訓練研究。這是 2026 年 AI 業界最轟動的人才移動,也是 Anthropic 向外界宣示——「AI 加速 AI 研究」,才是它對抗 OpenAI 與 Google 的核心籌碼。
2026 年 5 月 19 日,AI 業界人才大戰迎來了一個新的轉折點。Andrej Karpathy——OpenAI 共同創辦人、前特斯拉 AI 總監,同時也是深度學習時代最具代表性的研究者之一——正式宣布加入 Anthropic,負責領導 Claude 的預訓練研究,並籌建一支全新的研究團隊。
他在 X 上寫道:「我非常興奮能加入這個團隊,回到研發的第一線。我認為,接下來幾年是大型語言模型發展最具決定性的時期。」
這則公告在業界引發立即的震動。Karpathy 的名字在 AI 研究圈代表著一種難以複製的份量——他有紮實的基礎研究背景、在兩家最具影響力的公司累積的實戰經驗,以及罕見的技術溝通能力。他在此刻選擇加入 Anthropic,本身就是一個有力的訊號。
預訓練:最被低估的競爭戰場
要理解這次人事異動的深遠意義,得先搞清楚「預訓練」到底是什麼,以及為什麼它至今仍是大型語言模型最關鍵、卻最少被公開討論的競爭場域。
預訓練是讓模型從海量文本、程式碼、科學論文等資料中學習的過程,發生在任何指令微調(fine-tuning)之前。這個階段決定了模型的「原始能力」:推理、記憶、邏輯演繹、舉一反三。一個模型能不能真正「思考」,而不只是高級的文字接龍,根本上取決於預訓練的品質。
OpenAI、Google DeepMind、Meta 等頂級實驗室在這個階段投入了驚人資源,從資料篩選管道的精密程度,到「用多少算力能換來多少能力提升」的 scaling law 研究,無不是兵家必爭之地。Anthropic 向來對 Claude 的技術細節守口如瓶,預訓練研究更是其中最不透明的一塊。
如今引入 Karpathy 來主導這個領域,是在對外宣示Anthropic的雄心。
用 Claude 打造更強的 Claude
這次招募最值得關注的,不只是 Karpathy 的個人資歷,而是他獲得的具體任務。他不是加入 Anthropic 現有的預訓練團隊,而是要籌建一支全新的研究小組,專門探索如何用 Claude 本身來加速預訓練研究。
這個思路有時被稱為「AI 輔助科學研究」,和科幻小說裡的「遞迴自我改進」不同——不是讓 AI 改寫自己的權重或架構,而是讓前沿 AI 助理承擔預訓練研究過程中那些費時費力的工作:設計實驗、撰寫分析程式、解讀模型行為、評估假說,以及從龐大資料集中找出人類研究者可能錯過的規律。
這個方式的威力在於複利效應。一個原本要研究員花一週設計、執行、分析的實驗,如果由 AI 承擔大部分前置工作,可能壓縮到幾個小時。研究週期一次次縮短,累積下來的優勢相當可觀。
Karpathy 將在預訓練部門主管 Nick Joseph 的領導下開展工作。「Anthropic 邀請他來建立這樣一支團隊,清楚地表明了它的判斷:真正讓它在競爭中保持領先的,是 AI 加速的研究模式,而不是單純砸更多算力。」一位熟悉該公司研究方向的業界觀察人士說。
一段塑造整個行業的職涯
Karpathy 在史丹佛大學師從李飛飛取得博士學位,早年關於卷積神經網路和圖像描述的研究,為深度學習革命奠定了部分實驗基礎。他是 2015 年 OpenAI 創立時的核心成員,參與了部分最早的大規模語言模型研究,也是 scaling law 相關實驗的早期見證者。
2017 年他離開 OpenAI 加入特斯拉,擔任 Autopilot 與 AI 副總裁,將自動駕駛團隊從約 40 人擴展到逾 150 人。他任內最具爭議、也最具代表性的決策,是力排眾議推動「純視覺」路線——放棄雷達,全面依賴攝影機。這個賭注當時遭到大量批評,如今卻已成為特斯拉 FSD 產品的根基。
2023 年他短暫回到 OpenAI,隨後在 2024 年初再度離職,創辦了 Eureka Labs——一家將 AI 應用於教育的新創公司。僅僅 18 個月後,他選擇放下這家親手創辦的公司,加入 Anthropic。
在研究工作之外,Karpathy 或許是 AI 領域最有影響力的技術教育者。他的開源課程——包括從零實作神經網路的教學系列,以及廣受歡迎的「miniGPT」課程——直接培育了數萬名工程師,其中許多人如今活躍於頂級 AI 實驗室和新創公司。這種從第一原理出發、清晰精準地解釋事物的能力,不是他研究深度的附加品,而是同一種思維習慣的不同表現。
Anthropic 的人才飛輪正在轉動
Karpathy 加入的時機,恰好是 Anthropic 歷史上最有底氣的時刻。公司最近公佈了首次盈利的季度,2026 年第二季營收達到 10.9 億美元。年化營收跑道已超過 40 億美元,主要由 Claude Code 拉動——後者已成為軟體工程師最常用的 AI 開發工具之一。
Google 承諾了最高 400 億美元的總投資,估值定在 3500 億美元。Anthropic 還取得了 SpaceX Colossus 超算叢集的訓練資源。公司已不再是一個在商業化競爭對手陰影下默默做安全研究的實驗室,而是在定義何謂「前沿」。
能在這個時刻吸引 Karpathy,說明 Anthropic 已進入人才吸引力的正向循環。有選擇的研究者——而 Karpathy 幾乎可以去任何他想去的地方——傾向選擇他們認為正在發生最重要工作的地方。他的選擇本身,就是一種認可。
值得一提的是,這個選擇同時說明了 Karpathy 對 Anthropic「安全優先」立場的認同。他不是「雖然那裡重視安全、但還是選擇加入」,而是多次公開表示過對 AI 系統與人類價值觀對齊問題的重視。Anthropic 的安全使命,是他決策中的加分項,而非包袱。
下一代 Claude 將會如何?
Karpathy 尚未透露具體的研究方向或時間表。但他的加入,加上 Anthropic 不斷擴張的算力資源與更大規模的訓練計畫,意味著下一次重大的 Claude 訓練將與以往截然不同。
這能否讓 Claude 在對抗 GPT-5.5 和 Gemini 3.5 Flash 的競爭中取得決定性優勢?目前還無法確知。但可以確定的是:Anthropic 已在短時間內同時集齊了資金與人才,具備了認真角逐下一代前沿模型的籌碼。
Karpathy 選了他的位置。接下來,整個行業都將盯著他在這個位置上做出什麼。