4月17日消息。近日,谷歌宣布了一項重大更新:其人工智能工具Gemini Live將免費向所有安卓用戶開放。這一功能此前僅限Pixel 9和三星Galaxy S25用戶通過付費訂閱Gemini Advanced使用,但因用戶反饋積極,谷歌決定將其推廣至更廣泛的安卓生態。
Gemini Live的核心能力在于通過手機攝像頭或屏幕實時捕捉內容,并基于AI技術提供即時響應。例如,用戶在水族館拍攝魚類時,Gemini可自動識別物種并展示相關科普信息;面對屏幕上的文字或圖像,用戶也可通過語音或文字交互獲取進一步解釋或操作建議。
此外,該功能支持自然語言對話,用戶可隨時打斷AI補充細節或切換話題,無需重啟對話流程,提升了交互的流暢性。
Gemini Live最初作為付費功能推出后,用戶對其便捷性和實用性的高度評價促使谷歌調整策略。谷歌在社交平臺X上表示:“用戶的熱烈反響讓我們決定將這一功能免費開放,讓更多人體驗AI帶來的變革。”
這一決策也反映了科技公司在AI普及領域的競爭加劇。同一天,微軟宣布其類似工具Copilot Vision已在Edge瀏覽器中免費上線,進一步凸顯了行業對AI工具平民化的重視。
從4月17日起,Gemini Live將逐步向所有安裝Gemini應用的安卓設備推送,預計未來幾周內完成全球覆蓋。用戶需通過Google Play商店更新至最新版應用,點擊右下角的波形圖標即可啟動功能。
目前,該功能僅支持英語交互,且暫未登陸iOS平臺。不過,谷歌透露未來將擴展至更多語言和操作系統。
Gemini Live的應用場景極為多樣:
1. 教育輔助:實時翻譯或解析屏幕上的學術內容。
2. 旅游導覽:通過攝像頭識別地標、動植物并提供背景知識。
3. 日常辦公:快速提取屏幕文本生成摘要或執行指令。
這一功能的免費化不僅降低了AI技術的使用門檻,也為開發者提供了新的集成方向,例如與教育、旅游類應用的深度合作。
谷歌與微軟同日發布免費AI工具,標志著行業競爭進入新階段。OpenAI雖在語音交互領域先行一步,但其高級語音模式仍局限于付費訂閱用戶,而谷歌通過免費策略可能搶占更多市場份額。
未來,多模態交互(如結合攝像頭、語音和屏幕內容)或成為AI助手升級的重點。谷歌已透露計劃將Gemini Live整合至更多服務中,進一步拓展其應用邊界。