跳至主要內容
FAQ

Android 17 正式推送 Pixel:Gemini Omni 剪片、Lyria 3 作曲、全新多工介面一次到位

Google 於 6 月 16 日向 Pixel 裝置推送 Android 17,此次更新是 Android 史上 AI 功能密度最高的版本,包含 Gemini Omni 多模態影片編輯、Lyria 3 AI 音樂生成、Pixel 10a 專屬的 AudioLM 即時語音翻譯,以及重新設計的 Bubble Bar 多工介面。但最受期待的 Gemini Intelligence 自主代理功能,絕大多數 Pixel 用戶仍須等待。

1 分鐘閱讀

Google 於 6 月 16 日(週二)將 Android 17 推送至 Pixel 裝置,並同步釋出每月的 Pixel Drop 功能批次更新。這是 Android 歷史上 AI 功能整合密度最高的一次更新——亮點不在單一殺手級功能,而在同一時間點落地的 AI 能力之廣之深。

時機選擇頗具深意。蘋果在 2026 年的 WWDC 展示了整合更深的 Gemini 功能(延續去年 WWDC 宣布的蘋果與 Google 合作)。Android 17 是 Google 的回應:向外界証明,Android 這個原生平台有能力推出真實可用的 AI 功能,而不只是預覽和承諾。

Gemini Omni:在對話框裡剪片

Android 17 最核心的 AI 新功能是 Gemini Omni——一個將影片編輯直接整合進 Gemini 應用程式對話中的多模態模型。

概念直接,但執行方式真正創新。使用者不需要打開獨立的影片編輯 App,只需在 Gemini 對話中分享影片,然後用自然語言描述想要的修改——「剪掉這一段」「調整色溫」「加字幕」「把前十五秒的環境音刪掉」。Gemini Omni 同時理解影片內容與文字指令,完成編輯後將修改後的影片直接回傳至對話視窗。

這在本質上與 2024 年以來各大影片 App 紛紛推出的「AI 輔助剪輯」功能截然不同。那些功能是把 AI 當成編輯介面裡的一個按鈕;Gemini Omni 讓對話本身成為介面。剪片、寫信、安排行程,全都在同一個聊天視窗完成——交互模式統一了。

此功能首先在 Pixel 8 至 10a 推出,需要 Gemini 應用程式,且為 Gemini Pro 訂閱者獨享,免費用戶會在使用前看到升級提示。

Lyria 3:Android 上的 AI 作曲功能

Google AI 音樂生成模型 Lyria 3 也隨 Android 17 整合進 Pixel 裝置的 Gemini 應用程式。用戶只需描述一段音樂——曲風、情緒、速度、樂器組合、是否需要人聲——Lyria 3 便能依指示生成一段原創音樂。

Lyria 3 同時支援圖片輸入。用戶拍下一個場景——夕陽、街頭人潮、空曠房間——模型會依據視覺感受生成相應的背景音樂。這種文字加圖片的雙輸入設計,是為內容創作者量身打造的:目標不是「從樂理知識譜曲」,而是「找到符合畫面情緒的音頻」。

Lyria 3 的生成品質比 2025 年中推出的 Lyria 2 大幅提升:段落過渡更流暢,樂曲結構更有層次,對速度與樂器指示的遵從度也明顯改善。它仍定位為背景音樂與氛圍音效的生成工具,而非專業作曲的替代品,但對消費者影音創作而言,「夠用」的門檻已大幅降低。

AudioLM:Pixel 10a 的即時語音翻譯

今年初發布的 Pixel 10a 中階旗艦機,在 Android 17 中獲得了一項差異化能力:由 AudioLM 驅動的即時語音翻譯。

AudioLM 是 Google DeepMind 的語音語言模型,能直接處理和生成音訊,無需將語音轉為文字再進行翻譯。應用於翻譯場景時,系統得以保留說話者的語調特質——語氣、停頓、節奏、情感——而不只是翻譯文字,譯出的聲音因此聽起來更像真人說話,而非文字轉語音系統在唸稿。

實際使用上,Pixel 10a 現在可以作為近乎即時的雙向口譯裝置:一方以母語說話,手機翻譯後以自然語調輸出目標語言。系統支援 25 種最常見語言組合的離線翻譯,連線時可額外支援 75 種以上語言。

這不是第一款提供即時翻譯的手機,Google 的 Live Transcribe 和 Pixel 6 的口譯員模式都曾嘗試過。但 AudioLM 代表了語音輸出自然度的世代躍升,正面解決了過去翻譯工具在真實對話中「聽起來很怪」的核心體驗問題。

Bubble Bar:多工介面的結構性重設計

除了 AI 功能,Android 17 引入了 Bubble Bar——一次對多工介面的根本性變革。

Bubble Bar 取代了 Android 傳統的「最近應用」切換方式。活躍的 App 和對話可以固定為螢幕底部邊緣的懸浮氣泡,讓用戶在不離開當前情境的情況下快速切換。長按任一氣泡會展開該 App 當前狀態的持久小工具檢視,單擊則進入全螢幕。

這個設計在概念上近似 Android 早年為即時通訊 App 引入的「聊天頭貼」,但延伸至所有應用類別。導航 App 可以保持在氣泡狀態持續播放語音導航,用戶同時在前景瀏覽其他內容;音樂播放氣泡顯示播放控制,無需離開當前 App;來自不同即時通訊 App 的多個對話可以同時以氣泡形式共存。

Android 17 還新增了「畫面反應錄影」(同時捕捉自拍鏡頭與裝置螢幕,適合拍攝開箱或反應影片)、折疊螢幕遊戲模式(50/50 分割佈局與動態調整的虛擬遊戲手把),以及 Pixel 手機到 Pixel Watch 的即時 App 鏡像顯示。

Gemini Intelligence 的缺席

Android 17 最顯眼的缺席,是 Google 在今年 Google I/O 最重點預覽的功能:Gemini Intelligence——那個讓 Gemini 能跨 App 執行多步驟任務、自主完成購物、訂位、行程規劃等複雜指令的代理助理層。

Google I/O 2026 展示的 Gemini Intelligence,能理解像「幫我規劃十月東京行、在澀谷附近訂一間飯店、加進行事曆,並把行程傳給我的旅伴」這樣的長鏈條指示,一氣呵成執行。這才是真正具有轉型意義的手機 AI:一個會做事、而非只會回答問題的助理。

但這個功能並未出現在 Android 17。看完 Google I/O 後滿心期待的 Pixel 用戶,在這次更新說明中找不到它的蹤影。Google 發言人確認 Gemini Intelligence「將於未來的更新中陸續推出至支援裝置」,未給出具體時程。

Google 在 I/O 上的展示與實際推出之間的落差,是外界對 Google AI 策略的長年批評之一:功能往往在用戶能拿到手的幾個月前就已高調亮相。Android 17 的 AI 功能是真實的、有意義的,但那個能讓 Gemini 真正與蘋果在 iOS 27 描述的願景一較高下的功能,仍停在「即將到來」的狀態。

目前 Android 用戶能拿到的,是一個能生成音樂、在對話中剪片、更自然地翻譯語音,並以懸浮氣泡重構多工體驗的平台。這已是對 Android 16 的顯著躍升。下一個躍升——自主行動——仍在等待中。

Android 17 Gemini Omni Google Pixel Lyria 3 AudioLM 行動 AI Google 手機新功能
分享

相關報導