產品

Android 17 正式推送 Pixel：Gemini Omni 剪片、Lyria 3 作曲、全新多工介面一次到位

Google 於 6 月 16 日向 Pixel 裝置推送 Android 17，此次更新是 Android 史上 AI 功能密度最高的版本，包含 Gemini Omni 多模態影片編輯、Lyria 3 AI 音樂生成、Pixel 10a 專屬的 AudioLM 即時語音翻譯，以及重新設計的 Bubble Bar 多工介面。但最受期待的 Gemini Intelligence 自主代理功能，絕大多數 Pixel 用戶仍須等待。

13 小時前 1 分鐘閱讀

Google 於 6 月 16 日（週二）將 Android 17 推送至 Pixel 裝置，並同步釋出每月的 Pixel Drop 功能批次更新。這是 Android 歷史上 AI 功能整合密度最高的一次更新——亮點不在單一殺手級功能，而在同一時間點落地的 AI 能力之廣之深。

時機選擇頗具深意。蘋果在 2026 年的 WWDC 展示了整合更深的 Gemini 功能（延續去年 WWDC 宣布的蘋果與 Google 合作）。Android 17 是 Google 的回應：向外界証明，Android 這個原生平台有能力推出真實可用的 AI 功能，而不只是預覽和承諾。

Gemini Omni：在對話框裡剪片

Android 17 最核心的 AI 新功能是 Gemini Omni——一個將影片編輯直接整合進 Gemini 應用程式對話中的多模態模型。

概念直接，但執行方式真正創新。使用者不需要打開獨立的影片編輯 App，只需在 Gemini 對話中分享影片，然後用自然語言描述想要的修改——「剪掉這一段」「調整色溫」「加字幕」「把前十五秒的環境音刪掉」。Gemini Omni 同時理解影片內容與文字指令，完成編輯後將修改後的影片直接回傳至對話視窗。

這在本質上與 2024 年以來各大影片 App 紛紛推出的「AI 輔助剪輯」功能截然不同。那些功能是把 AI 當成編輯介面裡的一個按鈕；Gemini Omni 讓對話本身成為介面。剪片、寫信、安排行程，全都在同一個聊天視窗完成——交互模式統一了。

此功能首先在 Pixel 8 至 10a 推出，需要 Gemini 應用程式，且為 Gemini Pro 訂閱者獨享，免費用戶會在使用前看到升級提示。

Lyria 3：Android 上的 AI 作曲功能

Google AI 音樂生成模型 Lyria 3 也隨 Android 17 整合進 Pixel 裝置的 Gemini 應用程式。用戶只需描述一段音樂——曲風、情緒、速度、樂器組合、是否需要人聲——Lyria 3 便能依指示生成一段原創音樂。

Lyria 3 同時支援圖片輸入。用戶拍下一個場景——夕陽、街頭人潮、空曠房間——模型會依據視覺感受生成相應的背景音樂。這種文字加圖片的雙輸入設計，是為內容創作者量身打造的：目標不是「從樂理知識譜曲」，而是「找到符合畫面情緒的音頻」。

Lyria 3 的生成品質比 2025 年中推出的 Lyria 2 大幅提升：段落過渡更流暢，樂曲結構更有層次，對速度與樂器指示的遵從度也明顯改善。它仍定位為背景音樂與氛圍音效的生成工具，而非專業作曲的替代品，但對消費者影音創作而言，「夠用」的門檻已大幅降低。

AudioLM：Pixel 10a 的即時語音翻譯

今年初發布的 Pixel 10a 中階旗艦機，在 Android 17 中獲得了一項差異化能力：由 AudioLM 驅動的即時語音翻譯。

AudioLM 是 Google DeepMind 的語音語言模型，能直接處理和生成音訊，無需將語音轉為文字再進行翻譯。應用於翻譯場景時，系統得以保留說話者的語調特質——語氣、停頓、節奏、情感——而不只是翻譯文字，譯出的聲音因此聽起來更像真人說話，而非文字轉語音系統在唸稿。

實際使用上，Pixel 10a 現在可以作為近乎即時的雙向口譯裝置：一方以母語說話，手機翻譯後以自然語調輸出目標語言。系統支援 25 種最常見語言組合的離線翻譯，連線時可額外支援 75 種以上語言。

這不是第一款提供即時翻譯的手機，Google 的 Live Transcribe 和 Pixel 6 的口譯員模式都曾嘗試過。但 AudioLM 代表了語音輸出自然度的世代躍升，正面解決了過去翻譯工具在真實對話中「聽起來很怪」的核心體驗問題。

Bubble Bar：多工介面的結構性重設計

除了 AI 功能，Android 17 引入了 Bubble Bar——一次對多工介面的根本性變革。

Bubble Bar 取代了 Android 傳統的「最近應用」切換方式。活躍的 App 和對話可以固定為螢幕底部邊緣的懸浮氣泡，讓用戶在不離開當前情境的情況下快速切換。長按任一氣泡會展開該 App 當前狀態的持久小工具檢視，單擊則進入全螢幕。

這個設計在概念上近似 Android 早年為即時通訊 App 引入的「聊天頭貼」，但延伸至所有應用類別。導航 App 可以保持在氣泡狀態持續播放語音導航，用戶同時在前景瀏覽其他內容；音樂播放氣泡顯示播放控制，無需離開當前 App；來自不同即時通訊 App 的多個對話可以同時以氣泡形式共存。

Android 17 還新增了「畫面反應錄影」（同時捕捉自拍鏡頭與裝置螢幕，適合拍攝開箱或反應影片）、折疊螢幕遊戲模式（50/50 分割佈局與動態調整的虛擬遊戲手把），以及 Pixel 手機到 Pixel Watch 的即時 App 鏡像顯示。

Gemini Intelligence 的缺席

Android 17 最顯眼的缺席，是 Google 在今年 Google I/O 最重點預覽的功能：Gemini Intelligence——那個讓 Gemini 能跨 App 執行多步驟任務、自主完成購物、訂位、行程規劃等複雜指令的代理助理層。

Google I/O 2026 展示的 Gemini Intelligence，能理解像「幫我規劃十月東京行、在澀谷附近訂一間飯店、加進行事曆，並把行程傳給我的旅伴」這樣的長鏈條指示，一氣呵成執行。這才是真正具有轉型意義的手機 AI：一個會做事、而非只會回答問題的助理。

但這個功能並未出現在 Android 17。看完 Google I/O 後滿心期待的 Pixel 用戶，在這次更新說明中找不到它的蹤影。Google 發言人確認 Gemini Intelligence「將於未來的更新中陸續推出至支援裝置」，未給出具體時程。

Google 在 I/O 上的展示與實際推出之間的落差，是外界對 Google AI 策略的長年批評之一：功能往往在用戶能拿到手的幾個月前就已高調亮相。Android 17 的 AI 功能是真實的、有意義的，但那個能讓 Gemini 真正與蘋果在 iOS 27 描述的願景一較高下的功能，仍停在「即將到來」的狀態。

目前 Android 用戶能拿到的，是一個能生成音樂、在對話中剪片、更自然地翻譯語音，並以懸浮氣泡重構多工體驗的平台。這已是對 Android 16 的顯著躍升。下一個躍升——自主行動——仍在等待中。

資料來源

Android 17 Gemini Omni Google Pixel Lyria 3 AudioLM 行動 AI Google 手機新功能