跳至主要內容
FAQ

馬斯克在宣誓證詞中承認:xAI曾「部分」蒸餾OpenAI模型以訓練Grok

在馬斯克訴Altman案的關鍵時刻,馬斯克在聯邦法庭宣誓作證,承認xAI對OpenAI模型使用了蒸餾技術以訓練Grok——此舉可能違反OpenAI服務條款,也引發了業界對這種廣泛暗中流行做法的深層拷問。

1 分鐘閱讀

馬斯克走進奧克蘭聯邦法院,是要指控OpenAI背叛了公眾信任。然而他在庭上的一番話——本次審判迄今最令人瞠目的時刻之一——反倒清晰地映照出整個AI行業或許都在做著他正指控OpenAI所做的事:暗中借助他人的成果,卻在公開場合搶占道德高地。

4月30日周四,在反詰問環節,馬斯克被問及xAI是否曾對OpenAI的模型使用蒸餾技術以協助訓練Grok。他的回答是:「一般來說,AI公司都會蒸餾其他AI公司的模型。」當被追問是或否,他給出了一個隨即震動業界的單音節詞:「部分。」

蒸餾技術究竟是什麼

要理解馬斯克的承認為何如此重要,首先需要了解什麼是模型蒸餾——以及它為何成為AI競爭的爭議焦點。

在機器學習中,蒸餾是一種讓較小、效率更高的模型模仿更大、更強大模型行為的技術。在最常見的形式下,一家公司透過API或公開介面大規模查詢競爭對手的模型,收集其回應,再將這些回應作為訓練資料用於自家模型。結果是:一個「學生」模型吸收了「教師」模型的模式、推理風格與能力——通常是在教師毫不知情的情況下。

其吸引力顯而易見:訓練一個真正的前沿模型需要數億乃至數十億美元的算力投入。蒸餾提供了一條捷徑——透過系統性地查詢競爭對手耗資數十億美元訓練的模型並收集其輸出,以極低的成本將等同多年昂貴訓練的成果融入自家系統。

然而,這一做法的法律地位相當模糊。在美國法律下,蒸餾並非明確違法,但可能違反AI公司對其API設定的服務條款——而OpenAI的服務條款明確禁止將其模型輸出用於訓練競爭系統。這究竟構成著作權侵害、商業秘密盜用,還是僅是一條尚未執行的合約條款,目前法律界仍在積極爭論之中。

自我打臉的諷刺

這場法庭諷刺幾乎是量身定制的。馬斯克在奧克蘭法院花了好幾週,主張OpenAI背叛了一項根本性承諾——他聯合創立的這家公司曾承諾為全人類造福而開發AI,而非讓其員工和投資人致富。他索賠1340億美元,要求解除Sam Altman和Greg Brockman在OpenAI的職務,並撤銷公司轉型為營利機構的決定。

然而,他就在那裡,在聯邦法庭宣誓作證,承認xAI——他在公開抨擊OpenAI期間建立的AI公司——自己也曾以OpenAI的模型作為訓練資料。他部分承認的這種技術,正是OpenAI律師所描述的「對其智慧財產和競爭優勢的不當挪用」。

馬斯克的辯護是將這種做法正常化:「一般來說,AI公司都會蒸餾其他AI公司的模型。」這可能是事實。但這也正是他起訴的公司有時用來為自身游走邊緣行為辯護的邏輯——每個人都在這麼做,這是業界慣例,道德邊界從未有過被後來的受害者所描繪的那般清晰。

OpenAI的法律團隊迅速把握了這一承認,它完美契合了他們的反敘事:馬斯克並非一個保護公眾免受OpenAI企業化侵蝕的原則性揭弊者,而是一個透過利用他聲稱應屬於公眾的同一套基礎設施與知識,建立起自己AI帝國的競爭者。

全行業的照鏡時刻

馬斯克的「部分」一詞,落在了整個AI行業一直在迴避的更大議題正中央:當今頂尖模型究竟在多大程度上是透過相互學習構建起來的。

蒸餾的做法——在業界往往以「合成資料生成」或「知識遷移」等更無害的名稱稱呼——按大多數專家的評估,已相當普遍。2025年初,當DeepSeek發布其R1模型,以遠低於競爭對手的價格實現可比的能力時,研究界最先提出的問題之一便是:它如何以如此低的成本達到這種效果?一個有著行為和結構分析支撐的主要理論,是DeepSeek對包括GPT-4o和Claude在內的前沿模型進行了蒸餾。OpenAI當時表示正在調查「蒸餾的證據」。

更廣泛地看,過去兩年間大量湧現的優秀小型開源模型生態,在某種程度上都依賴前沿模型的存在。這些知識不是憑空轉移的;它被提取出來——有時通過合法手段(研究人員在公開共享的輸出上訓練),有時則通過遊走法律灰色地帶的方式。

馬斯克的承認之所以不同,在於它是在聯邦法院宣誓作證的情況下發生的,而這場訴訟可能為AI開發實踐設立法律先例。正如在對本案進行分析的文章中引用的一位智財律師所說:「當你利用另一家公司的專有系統來蒸餾模型,你實際上是將那家公司的智慧財產編碼進了你自己的產品——不僅僅是複製文字或圖像,而是捕獲了那家公司花費數十億美元才建立起來的學習模式、推理結構與知識表徵。」

業界反制動作

這一承認已促使人們討論業界正在推進的防禦策略。據報導,OpenAI、Anthropic和Google已透過前沿模型論壇(Frontier Model Forum)協調識別和打擊蒸餾行為的工作——典型特徵是系統性的大規模查詢模式,明顯異於正常的有機API使用。前沿實驗室正在開發限速和行為偵測系統,旨在識別API使用者何時在進行訓練資料採集式的查詢,而非正常的產品開發。

這是一場沒有乾淨結局的軍備競賽。蒸餾偵測並非精確科學;合法客戶有時也會在生產應用中進行高頻查詢。追究蒸餾行為的法律框架尚不成熟且未經檢驗。而且,按馬斯克自己的說法,這一做法已如此普遍,任何積極的法律行動都將牽涉業界的絕大多數玩家。

接下來會怎樣

對於馬斯克訴Altman案本身而言,蒸餾承認是OpenAI法律團隊的一份意外之禮——不一定是因為它為馬斯克創造了新的法律責任,而是因為它動搖了他案件的道德基礎。馬斯克將自己定位為保護公眾免受OpenAI企業收割的原則性行動者。而他的宣誓證詞顯示,xAI在他公開攻擊OpenAI是對公眾信任的背叛的同時,悄悄使用了OpenAI的模型——這兩者難以自洽。

審判將持續至5月底,Sam Altman、Greg Brockman和微軟CEO薩蒂亞·納德拉均已被列為潛在證人出庭作證。無論陪審團最終如何裁定馬斯克那1340億美元的賠償請求,那個正在起訴OpenAI的男人在反詰問中承認自家公司曾借助OpenAI的模型構建競爭產品的時刻,已永遠寫入了庭審記錄。

更深層的問題——誰擁有嵌入大型語言模型中的潛在知識,透過系統性查詢將其提取是否構成不當挪用——最終或許不會在這間法庭裁決,而將在馬斯克訴Altman案無意中點燃的未來訴訟中見分曉。

馬斯克 xAI OpenAI Grok 模型蒸餾 訴訟 AI訓練 智慧財產權
分享

相關報導

馬斯克親上證人席:OpenAI世紀官司開庭,1340億美元恩怨全面攤牌

馬斯克與OpenAI執行長阿特曼之間的世紀訴訟,4月28日在加州奧克蘭聯邦法庭正式開審。馬斯克親自出庭作證,聲稱他創辦OpenAI的初衷是為了制衡Google,而OpenAI則反指馬斯克不過是在一場權力鬥爭失敗後,藉訴訟打擊競爭對手。此案索賠金額高達1340億美元,判決結果將深刻影響全球AI產業的治理走向。

1 分鐘閱讀

馬斯克出庭作證兩天:OpenAI世紀審判第一週爆點回顧

馬斯克對決奧特曼的聯邦審判結束了爆炸性的第一週:馬斯克在證人席上待了近兩整天,描述他認為奧特曼背叛的非營利創辦願景,並就2026年1.3兆美元求償核心的2018年投資備忘錄與律師展開激烈交鋒。第二週從週一啟動,奧特曼預計將出庭作證,岡薩雷斯-羅傑斯法官的裁決預計於五月中旬前出爐。

1 分鐘閱讀