ChatGPT版Her被玩瘋:哭著讀詩 中文表現(xiàn)也很亮
上線僅僅一天,GPT-4o的高級(jí)語音功能(Advanced Voice Mode)簡直要被玩瘋了。
無數(shù)網(wǎng)友腦洞大開的瘋狂測試,GPT-4o這邊呢,不僅各種奇葩任務(wù)全盤接收,表現(xiàn)好到更是讓不少人連連驚呼“Blow my mind”。
例如有位網(wǎng)友要求GPT-4o用中文講個(gè)故事,它的表現(xiàn)是這樣的:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
很多懂中文的網(wǎng)友看罷,紛紛表示不論是情緒還是整體的描述,GPT-4o的表現(xiàn)都比較OK。
但也并非完美,例如它的語速略顯慢了些,以及把“氣”讀成了“kì”。
還有更像人的例子,仔細(xì)聽:

視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
你沒聽錯(cuò),GPT-4o在讀美國女詩人Emiliy Dickinson的作品時(shí),她哭了!
(頗有種情到深處自然濃的感覺)
這效果可把網(wǎng)友們嚇得不輕,表示“毛骨悚然”。
然而這還只是網(wǎng)友們瘋狂測試的一隅,還有很多好玩的例子,我們繼續(xù)往下看。
數(shù)1-100,賊快
如果讓你用英文從1數(shù)到10,越快越好,你需要幾秒?
有網(wǎng)友就給GPT-4o提了這個(gè)要求,來感受下AI的語速:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
當(dāng)網(wǎng)友要求它以更快的速度讀1-10時(shí),“AI字幕”識(shí)別功能都失效了。
而當(dāng)GPT-4o被要求速讀1-50時(shí),我們還可以聽到他還會(huì)像人一樣有大口換氣的動(dòng)作。
接下來,這位網(wǎng)友提出了更高的要求——速讀1-100:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
雖然前期沒有完全get網(wǎng)友的要求,但在他不斷地引導(dǎo)之下,GPT-4o最終還是完成了速讀1-100的任務(wù)。
除此之外,在搞怪方面,GPT-4o學(xué)貓叫也是一絕:

視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
(我們一起學(xué)貓叫,一起喵喵喵~)
當(dāng)然,以實(shí)時(shí)性和多語種出圈的語音功能,網(wǎng)友定然也不會(huì)放過測試這項(xiàng)任務(wù)。
主打一個(gè)隨意打斷、隨意切換:
烏爾都語→希伯來語→挪威語→摩洛哥達(dá)利加語→阿姆哈拉語→匈牙利語→格魯吉亞語→克林貢語。
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
還有更加實(shí)用的功能。
例如如果你在玩一款日本游戲,但卻看不懂日文,那就直接讓GPT-4o來幫忙就好了:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
好家伙,GPT-4o直接搖身一變,成了實(shí)時(shí)翻譯官了。
“自然的語音是關(guān)鍵”
除了上面這些具體的案例,沃頓商學(xué)院教授Ethan Mollick也談了談他的感受。
他將GPT-4o的高級(jí)語音功能總結(jié)為三點(diǎn):
它和OpenAI當(dāng)時(shí)演示的效果一樣好。它顯然能夠生成更多音頻,但存在限制。它令人毛骨悚然。大量無意識(shí)的線索讓人感覺像是在與一個(gè)人交談。
并且Ethan教授還認(rèn)為,這種非常自然、擬人的語音,正是改變?nèi)祟惻cAI交互性質(zhì)的關(guān)鍵(雖然底層模型是我們用了很久的那個(gè))。
但實(shí)際上,高級(jí)語音模式與ChatGPT現(xiàn)有的語音功能存在明顯差異。
ChatGPT 之前的語音處理方式依賴于三個(gè)不同的模型:首先是將語音信號(hào)轉(zhuǎn)化為文字的模型,其次是 GPT-4 用于解析和回應(yīng)用戶指令,最后是將 ChatGPT 的輸出文本轉(zhuǎn)換為語音的模型。
相比之下,GPT-4o 具備多模態(tài)能力,能夠獨(dú)立完成這些任務(wù),無需其他模型的輔助,這大大減少了對(duì)話過程中的等待時(shí)間。
此外,OpenAI 還強(qiáng)調(diào) GPT-4o 能夠識(shí)別并響應(yīng)用戶語音中的情感變化,例如能夠感知到悲傷、興奮等情緒。
而隨著越來越多網(wǎng)友曬出他們的測試結(jié)果,底下的吃瓜群眾們是按耐不住了,紛紛表示希望OpenAI快點(diǎn)讓更多人體驗(yàn)上。
那么你覺得用GPT-4o的高級(jí)語音功能,還能有什么更有意思的玩法?歡迎在評(píng)論區(qū)留言討論~
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來信告知我們刪除。郵箱:business@qudong.com










