跳至主要內容
FAQ

xAI 推出 Grok 4.3 Beta:200 萬 Token 上下文、原生影片理解,並同步開放 Grok Computer 自主 PC 代理

馬斯克旗下 xAI 以每月 300 美元的 SuperGrok Heavy 方案為入口,推出 Grok 4.3 早期測試版,帶來 200 萬 token 上下文視窗、原生影片理解及文件創作能力。與此同時,與特斯拉共同以 20 億美元押注的 Macrohard 計畫旗下自主 PC 代理 Grok Computer 也同步進入公開測試。

1 分鐘閱讀

過去 48 小時,馬斯克旗下 xAI 同時做了兩件大事,合在一起代表了這家公司自最初 Grok 發布以來最具野心的產品攻勢。4 月 17 日,xAI 向 SuperGrok Heavy 訂閱者推出 Grok 4.3 早期測試版;與此同時,自主 PC 代理 Grok Computer 進入更廣泛的公開測試,馬斯克確認大規模公測將在數天內啟動。

這兩個發布共同指向 xAI 對 AI 助手未來走向的核心押注:不是回應單一問題的工具,而是能理解長期脈絡、跨模態運作、並最終代表使用者採取行動(包括直接操控電腦)的持久代理。

Grok 4.3 帶來什麼

4.3 版最核心的技術升級,是 200 萬 token 的上下文視窗——在這個價格層級的公開模型中最大。這大約等於 150 萬個英文單字,足以讓模型一次性消化整個大型軟體程式庫、多年的文件檔案,或維繫跨越數月的完整對話記憶。

原生影片理解是第二項重大新增。不同於以採樣幀方式處理影片的影像模型,Grok 4.3 能讀取連續影片流並推理事件的時序關係——不只理解畫面中有什麼,還能理解動作與狀態如何隨時間演變。實際應用涵蓋監控影像分析、教學影片解析,以及加入視覺脈絡的會議轉錄。

模型還新增了原生文件創作功能:使用者可直接請 Grok 4.3 生成格式化 PDF、PowerPoint 簡報和試算表,無需透過第三方工具匯出。xAI 的實作將此功能與 200 萬 token 上下文深度整合,意味著可以基於超大來源語料庫直接生成文件。

馬斯克在 X 上確認,Grok 4.3 是持續疊代的開發版本而非定版發布,預計「幾乎每天更新」。兆級參數版本仍在訓練中,馬斯克表示它將大幅提升程式碼能力、長上下文處理與推理深度。

每月 300 美元的定位邏輯

存取 Grok 4.3 所需的 SuperGrok Heavy 訂閱定價為每月 300 美元,刻意高於 OpenAI ChatGPT Pro(200 美元/月)和 Anthropic Claude Max(最高 200 美元/月)。這不是定價失誤,而是經過計算的市場定位。

xAI 顯然瞄準的是將 AI 作為生產工具而非生產力補充的頂端專業用戶群體。在每月 300 美元的前提下,Grok 4.3 必須為每天處理大量複雜資訊的工程師、分析師和業務操作人員創造可量化的投資回報。200 萬 token 上下文視窗與原生影片能力,正是為了創造在更低價位無法達到的使用價值。

早期評測者描述文件創作與影片理解確有差異化優勢,但核心推理性能被認為與 Anthropic 和 Google 的最新模型相當,尚未呈現明顯領先。

Grok Computer:自主代理層

在 Grok 4.3 之外,Grok Computer 在結構上意義更為深遠。如果說 Grok 4.3 是對話模型的升級,Grok Computer 則是將 AI 代理能力延伸至桌面環境的嘗試——超越任何聊天介面所能達到的邊界。

核心能力描述起來直觀,但技術實現複雜:Grok Computer 能看見你的螢幕、理解螢幕上的內容,並採取行動——點擊、輸入文字、切換應用程式、填寫表單、執行終端指令,以及串接多步驟工作流程——無需任何 API 整合或應用程式專屬設定。

它透過像素層級的螢幕讀取,配合持續 5 秒的影片緩衝來理解 UI 狀態與應用程式脈絡。由於在像素層級而非 API 層級運作,它可以與任何軟體配合,包括早於現代 API 規範的 2000 年代遺留應用程式。

根據 xAI 的說明,Grok Computer 可以完成以下完整工作流程:在瀏覽器中研究一個主題、將結果整合成結構化試算表、將試算表格式化為簡報,然後以電子郵件寄送給指定收件人——全程自動執行,無需人工介入任何環節。

Macrohard:特斯拉與 xAI 的聯合押注

Grok Computer 並非獨立產品。它是馬斯克於 2026 年 3 月 11 日以「Macrohard」為名發布的更大計畫的消費者預覽——這個名字是對微軟的刻意挑釁。Macrohard 是特斯拉與 xAI 的聯合項目,由特斯拉向 xAI 注資 20 億美元支持,目標是打造一套由 Grok 模型驅動的完整軟體生產力套件。

戰略邏輯清晰:能自主操作電腦的模型,距離能自主操作機器人只有一步之遙——而特斯拉的 Optimus 人形機器人計畫,恰恰需要 Grok Computer 正在開發的這類桌面到物理世界的代理能力。

馬斯克確認 Grok Computer 將在數天內擴大公測規模,目前版本基於 Grok 4.20 Beta 2,能力被刻意限制以確保穩定性。完整能力版本預計以 Grok 5 為基礎,定位為 2026 年下半年的重大里程碑。

競爭格局

這兩個發布出現在自主代理市場競爭日趨激烈之際。OpenAI 本週更新的 Agents SDK 提供了開發者構建代理工作流的框架,Anthropic 的 Claude 也具備電腦使用能力。Google 據報正在開發自己的 PC 代理產品。微軟則在 Windows 11 中深度整合了 Copilot。

xAI 的差異化優勢,若能兌現,將來自垂直整合:自有模型(Grok)、自有分發渠道(月活超 6 億的 X/Twitter)以及自有物理世界應用(特斯拉 Optimus)。這個組合架構,其他任何競爭者都不具備。這個架構最終能否產出明顯優於競爭對手的產品,還是僅有所不同,仍有待驗證。但 xAI 在 2026 年 4 月的出貨節奏,清楚表明它已進入執行模式,而非規劃模式。

xAI Grok 4.3 Grok Computer AI 代理 馬斯克 Macrohard
分享