谷歌:Android手機(jī)聽(tīng)我的 AI要這么做
搶先蘋(píng)果一個(gè)月,Google 將 AI+手機(jī)的可能性,全都展示在了自己的 Pixel 新機(jī)之中。
當(dāng)?shù)貢r(shí)間 8 月 13 日,Google 發(fā)布了 Pixel 9、Pixel 9 Pro 以及二代折疊屏 Pixel 9 Fold、智能手表、耳機(jī)等硬件新品。相比于硬件,人們更關(guān)注,在 AI+手機(jī)如此火熱的當(dāng)下,作為 Android 系統(tǒng)的管理者,Google 將會(huì)如何將端側(cè) AI 用于 Android 手機(jī)之中。
差不多在 10 個(gè)月前,谷歌推出了第一代 AI 手機(jī),如今不到一年,這家巨頭再次更新 Gemini、Android 和 Pixel 的產(chǎn)品組合,這一次,主打的是「競(jìng)爭(zhēng)對(duì)手有的,我也有」模式。
自 OpenAI 推出 ChatGPT 語(yǔ)音模式,以及蘋(píng)果下一代 iPhone 的 AI 功能曝光以來(lái),同行們能做到的,谷歌都不愿落下,包括 AI 語(yǔ)音對(duì)話、搜索屏幕截圖中的信息等。與此同時(shí),谷歌也在讓 AI 進(jìn)一步集成進(jìn)自身的應(yīng)用生態(tài)。
誰(shuí)才是 AI 手機(jī)領(lǐng)頭羊,Google 一定要和蘋(píng)果掰掰手腕。
回應(yīng) OpenAI,Gemini Live 上線
Gemini 是谷歌各種 AI 產(chǎn)品的基石,也是谷歌 Pixel 9 系列手機(jī)上的默認(rèn)助手,Gemini 在集成進(jìn)手機(jī)時(shí)有哪些升級(jí),是發(fā)布會(huì)上的一大焦點(diǎn)。
谷歌 Pixel 手機(jī)上的 Gemini 按下電源按鈕即可喚出。據(jù)谷歌高管稱,從今天開(kāi)始,用戶可以在使用的應(yīng)用程序上方調(diào)出 Gemini 的覆蓋層,詢問(wèn)有關(guān)屏幕上內(nèi)容的問(wèn)題。例如,用戶可以詢問(wèn)正在觀看的 YouTube 視頻的相關(guān)問(wèn)題,用戶還可以直接從 Gemini 的覆蓋層生成圖像,并將它們拖放到 Gmail 和 Google Messages 等應(yīng)用程序中。
谷歌還計(jì)劃在「未來(lái)幾周」讓 Gemini 連接更多應(yīng)用程序,包括日歷、Keep 和 YouTube Music 等。具體的功能用途如,讓 Gemini「制作一份讓我想起 90 年代末的歌曲播放列表?!埂概南卵莩獣?huì)傳單的照片,并讓 Gemini 查看那天是否有空——甚至設(shè)置提醒來(lái)購(gòu)買門票?!埂缸?Gemini 在你的 Gmail 中找到一份食譜,并要求它將配料添加到 Keep 中的購(gòu)物清單中。」
Gemini 使用截圖提取信息與更多應(yīng)用程序互動(dòng)|圖片來(lái)源:谷歌
除了這些集成體驗(yàn)外,谷歌還正式上線了 Gemini Live,這一功能可以說(shuō)是谷歌對(duì) OpenAI 推出的 GPT-4o 高級(jí)語(yǔ)音模式的回應(yīng)。該功能此前在谷歌 2024 年的 I/O 開(kāi)發(fā)者大會(huì)上曝光過(guò),今天開(kāi)始正式推出。
用戶可以用手機(jī)與谷歌的生成式 AI 聊天機(jī)器人 Gemini 進(jìn)行語(yǔ)音對(duì)話,可以中途打斷,提出跟進(jìn)的問(wèn)題,對(duì)話可以隨時(shí)暫停和恢復(fù)。一些具體用途例子包括,讓 Gemini Live 陪你準(zhǔn)備工作面試、練習(xí)演講,隨便聊聊關(guān)心的話題等。
Gemini Live 明顯要對(duì)標(biāo) GPT-4o 的語(yǔ)音交互|圖片來(lái)源:谷歌
那么,Gemini Live 相較于 ChatGPT 的語(yǔ)音模式有優(yōu)勢(shì)嗎?
據(jù)稱,支持 Live 的生成式 AI 模型架構(gòu)——Gemini 1.5 Pro 和 Gemini 1.5 Flash,擁有比平均水平更長(zhǎng)的「上下文窗口」,這意味著它們可以在生成響應(yīng)之前處理和推理大量數(shù)據(jù),理論上可以進(jìn)行長(zhǎng)達(dá)數(shù)小時(shí)的對(duì)話。
Gemini Live 還可免提使用,用戶可以在應(yīng)用后臺(tái)或手機(jī)鎖定時(shí)繼續(xù)進(jìn)行語(yǔ)音對(duì)話,有 10 種新聲音可以選擇。
但值得注意的是,Gemini Live 目前還未上線「多模態(tài)輸入」功能,據(jù)稱將于「今年晚些時(shí)候」推出。
幾個(gè)月前,谷歌曾經(jīng)發(fā)布了預(yù)錄視頻,展示了 Gemini Live 如何通過(guò)手機(jī)攝像頭捕捉的照片和視頻識(shí)別用戶周圍環(huán)境,并做出響應(yīng),比如指出損壞自行車的某個(gè)部件,或解釋計(jì)算機(jī)屏幕上一段代碼的功能,這些都未得到現(xiàn)場(chǎng)的真實(shí)演示。
而且,Gemini Live 在 Android 手機(jī)上的 Gemini Advanced 訂閱用戶中推出,并不是免費(fèi)的。目前它僅提供英文版本,谷歌稱「未來(lái)幾周」將擴(kuò)展到更多語(yǔ)言,還要通過(guò)應(yīng)用程序擴(kuò)展到 iOS。
谷歌高管直播演示 Gemini Live|圖片來(lái)源:谷歌
谷歌 Gemini 體驗(yàn)與谷歌助手方面的高管稱「谷歌正處于探索 AI 驅(qū)動(dòng)助手各種有用方式的早期階段——就像 Pixel 手機(jī)一樣,Gemini 將會(huì)越來(lái)越好?!?/p>
另外,在隱私問(wèn)題方面,谷歌 Android 生態(tài)系統(tǒng)方面的高管稱,Gemini 支持來(lái)自幾十個(gè)設(shè)備制造商的數(shù)百款手機(jī)型號(hào),在處理用戶數(shù)據(jù)時(shí),數(shù)據(jù)不會(huì)離開(kāi)手機(jī)。
「Gemini 可以基于你私人教練的郵件幫助創(chuàng)建每日鍛煉計(jì)劃,或利用你 Google Drive 中的簡(jiǎn)歷撰寫(xiě)工作簡(jiǎn)介。只有 Gemini 能夠通過(guò)這種安全的、一體化的方法做到這一切,而不需要將數(shù)據(jù)交給你可能不認(rèn)識(shí)或信任的第三方 AI 提供商。」谷歌 Android 生態(tài)系統(tǒng)總裁 Sameer Samat 稱。
「由于 Android 是首個(gè)擁有大型設(shè)備內(nèi)多模態(tài) AI 模型的移動(dòng)操作系統(tǒng)——名為 Gemini Nano——在處理一些最敏感的用例時(shí),你的數(shù)據(jù)不會(huì)離開(kāi)你的手機(jī)?!?/p>
AI進(jìn)一步融合進(jìn)Android
谷歌推廣 AI 手機(jī)的最大優(yōu)勢(shì)無(wú)疑是自家的多種應(yīng)用工具,以及 Android 生態(tài),谷歌現(xiàn)在有數(shù)十億 Android 用戶,能發(fā)揮的空間,顯然比一個(gè)聊天機(jī)器人應(yīng)用程序更多。
去年,作為首款以 AI 為核心的智能手機(jī),谷歌的 Pixel 8 系列帶來(lái)了各種 AI 功能。例如,用戶可以移除、移動(dòng)或編輯照片中的單個(gè)元素,可以在照片之間移動(dòng)表情以獲得最佳的合成照片,可以基于截圖或屏幕上的某個(gè)「圈選部分」進(jìn)行搜索等。
所有這些功能都首次出現(xiàn)在 Pixel 8 系列上,隨后在整個(gè) Android 生態(tài)系統(tǒng)中得到一定推廣。
像谷歌的「圈選搜索」功能,實(shí)際上首次出現(xiàn)在三星的 Galaxy AI 手機(jī)上,作為谷歌的 Android 生態(tài)合作伙伴,三星的手機(jī)還添加了許多類似的 AI 功能。前述 AI 助手 Gemini 也出現(xiàn)在三星的 Galaxy Z Fold6、摩托羅拉 Razr+等手機(jī)里。
與此同時(shí),其他制造商也宣布要推出自己的手機(jī) AI,過(guò)去幾個(gè)月最受關(guān)注的莫過(guò)于蘋(píng)果,相同的一個(gè)方向和理念是融合自家的應(yīng)用程序生態(tài)。
在這差不多一年時(shí)間里,「AI 手機(jī)」可以說(shuō)已經(jīng)成了市場(chǎng)看待手機(jī)的核心視角,不僅僅是谷歌手機(jī)。如何再用 AI 讓人眼前一亮,對(duì)谷歌來(lái)說(shuō)是個(gè)挑戰(zhàn)。目前來(lái)看,與推出第一代 AI 手機(jī) Pixel 8 時(shí)類似,谷歌輸出最多的還是各種 AI 功能小工具。
在今年的 Made By Google 活動(dòng)上,谷歌重點(diǎn)推出的 AI 新功能包括:
「Add Me」,即使是拍照的人也能把自己拍進(jìn)合照里;
「Pixel Studio」,一款 AI 圖像生成器,與蘋(píng)果即將推出的 Image Playground 應(yīng)用非常相似;
「Pixel Screenshots」,它可以掃描用戶圖庫(kù)中的截圖,將它們轉(zhuǎn)變?yōu)橐粋€(gè)易于搜索的數(shù)據(jù)庫(kù);
「Call Notes」,可以保存通話記錄中的信息摘要,激活該功能后通話中的每個(gè)人都會(huì)收到通知。
其中,如果想實(shí)現(xiàn)「Add Me」的功能,攝影師首先拍攝一張沒(méi)有自己的照片,然后由另一個(gè)人當(dāng)攝影師,再拍一張照片。Pixel 會(huì)將兩張照片合并,確保每個(gè)人都在一張照片里,無(wú)需找陌生人幫忙拍照。
集體合照功能|圖片來(lái)源:谷歌
谷歌給 Pixel 9 系列定位的一大賣點(diǎn)還有 AI 相機(jī),自封為「世界第一個(gè) AI 驅(qū)動(dòng)的相機(jī)」。谷歌高管還稱「Pixel 是第一個(gè)在照片和視頻中使用夜視功能的手機(jī),現(xiàn)在它也是第一個(gè)在低光環(huán)境下拍攝壯麗全景風(fēng)景和城市景觀的手機(jī)?!乖诎l(fā)布會(huì)上,谷歌高管還將 Pixel 9 Pro XL 拍攝的照片與蘋(píng)果的 iPhone 15 Pro Max 進(jìn)行對(duì)比。
谷歌手機(jī) vs 蘋(píng)果手機(jī)夜晚拍照效果|來(lái)源:谷歌
超大屏的折疊款 Pixel 9 Pro Fold 還有一個(gè)「Made You Look」功能,能用來(lái)吸引用戶的注意力,讓他們對(duì)著鏡頭笑。用該功能時(shí),展開(kāi)手機(jī),一側(cè)外屏上會(huì)播放引人注目的視覺(jué)動(dòng)畫(huà),比如一個(gè)亮黃色的小雞,或者其他搞怪的動(dòng)畫(huà)。
吸引用戶注意的屏幕功能|圖片來(lái)源:谷歌
拍完照之后,還有修圖工具,谷歌圖片的 Magic Editor 今年又推出了一些新功能。比如「Auto Frame」功能,用于校正傾斜照片的角度,同時(shí)使用生成式 AI 填補(bǔ)主體周圍的空白,形成更廣闊的視野。還有「Reimagine」功能,在文本框中描述想要的效果,就可以用生成式 AI 來(lái) P 圖,比如將地上的草變成野花,在天空的某個(gè)部分加個(gè)熱氣球等。
此外,谷歌緊隨蘋(píng)果的腳步,推出一種在緊急情況下使用「衛(wèi)星 SOS」功能,這項(xiàng)功能讓用戶可以在沒(méi)有蜂窩服務(wù)的情況下,聯(lián)系緊急救援人員并共享位置信息。據(jù)谷歌高管稱,Pixel 9 系列將是「首批能夠使用衛(wèi)星 SOS 的 Android 手機(jī)。」
衛(wèi)星 SOS 功能|圖片來(lái)源:谷歌
從功能上看,Pixel 9+ Gemini 的組合,并沒(méi)有在 AI 方面領(lǐng)先現(xiàn)在國(guó)內(nèi) Android 廠商太多。但要注意的是,與蘋(píng)果不同,Google 既有自己的系統(tǒng)和終端,又有大模型和云計(jì)算,是目前所有公司中在「軟硬芯云」真正完成閉環(huán)的公司。
一旦終端 AI 出現(xiàn)突破口,萬(wàn)事俱備的 Google「再次偉大」的可能性,要比競(jìng)爭(zhēng)對(duì)手大非常多。
也許,Google 欠缺的,只是一個(gè)更大的野心。
本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com