玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當(dāng)前的位置: 首頁 > 新聞 > 其他

科技巨頭搶灘智能語音市場,能否改變?nèi)伺c機(jī)器語音市場方式?

來源: 編輯:vbeiyou 時間:2017-05-19 08:55人閱讀
隨著人工智能的迅速崛起,新一輪核心技術(shù)變革已經(jīng)躍然眼前。語音技術(shù)作為最核心的入口,成為科技巨頭們爭相攻下的堡壘。亞馬遜,蘋果、微軟、谷歌、百度等多家科技巨頭也紛紛進(jìn)軍語音助手市場,該領(lǐng)域的競爭日趨激烈。 科技巨頭搶灘智能語音市場,能否改變?nèi)伺c機(jī)器語音市場方式?(圖1) 2016年是聊天機(jī)器人接管硅谷的一年,但語音技術(shù)能否從根本上撬動人與機(jī)器交互的龐大根基卻尚難定論。當(dāng)激進(jìn)的瞭望者們描述:物聯(lián)網(wǎng)爆發(fā)之際,語音技術(shù)何等不可思議,將徹底顛覆傳統(tǒng)復(fù)雜的手動操作模式等等,而一些冷靜的現(xiàn)實(shí)派確認(rèn)為:這些機(jī)器人并不怎么會聊天。 科技巨頭們的“語音”交互戰(zhàn) 為了能夠在這個即將到來的生態(tài)系統(tǒng)中搶占制高地,各大科技巨頭越來越重視語音技術(shù)發(fā)展。蘋果Siri依托于iPhone,亞馬遜Alex依托于Echo設(shè)備,在搜索和語言領(lǐng)域占據(jù)技術(shù)優(yōu)勢的谷歌卻在硬件發(fā)展上晚了一拍,最為消費(fèi)者所熟知的還是Google Home設(shè)備上的語音服務(wù),而微軟則眼光獨(dú)到,其人工智能旨在幫助人們做到更好,而不是與人競爭。 Facebook近日宣布啟動新的平臺ParlAI,加大語音識別研發(fā)力度,使計算機(jī)能與人進(jìn)行有意義的對話。而微軟與谷歌則展開了一場實(shí)力角逐。 科技巨頭搶灘智能語音市場,能否改變?nèi)伺c機(jī)器語音市場方式?(圖2) 在技術(shù)上,微軟有與谷歌TensorFlow想匹敵的人工智能開源開發(fā)工具CNTK,以及提供全部人工智能技術(shù)的Azure云。在業(yè)務(wù)上,微軟現(xiàn)在有三款聊天機(jī)器人,主打情感計算的小冰、主打商務(wù)助理的小娜,還有在垂直領(lǐng)域的深度應(yīng)用智能客服。在神經(jīng)網(wǎng)絡(luò)翻譯領(lǐng)域,Microsoft Translator已經(jīng)可以與Google Translate相匹敵。 百度則順利度過了和語音技術(shù)的“七年之癢”, 從最初的基于云端識別的互聯(lián)網(wǎng)應(yīng)用到如今成功將 HPC 技術(shù)移植到深度學(xué)習(xí)平臺,百度在語音技術(shù)方面的提升相當(dāng)可觀。 科技巨頭搶灘智能語音市場,能否改變?nèi)伺c機(jī)器語音市場方式?(圖3) 此外,智能手機(jī)的語音技術(shù)也逐漸走向產(chǎn)品化,像老羅發(fā)布新機(jī)堅果Pro,搭載“閃念膠囊”功能,采用訊飛輸入法語音識別技術(shù),一分鐘400字,抓住你的靈感一現(xiàn)。閃念膠囊其實(shí)就是一個語音技術(shù),包括傳聞已久的蘋果 Siri 音響也有幾分延續(xù)語音產(chǎn)品化熱度的可能。 吳恩達(dá)表示,“至少在中國,我們會在接下來幾年時間普及語音識別應(yīng)用,讓人機(jī)溝通成為一件非常自然的事。你會很快習(xí)慣與機(jī)器流暢交流的時光,而忘記以前是如何與機(jī)器交互的?!? 各大科技巨頭已經(jīng)紛紛搶灘智能語音市場,而人工智能的進(jìn)步與發(fā)展也讓語音技術(shù)的識別突飛猛進(jìn)。不過,從語音技術(shù)之爭到“語音技術(shù)+硬件”的較量,能夠看出只有能走進(jìn)廣大消費(fèi)者的語音技術(shù)才有可能真正打響第一槍。 語音技術(shù)發(fā)展痛點(diǎn):深度算法+噪音識別+語義理解 回歸到現(xiàn)實(shí)人類與機(jī)器的語音交互場景,從第一批興起的智能手機(jī)語音技術(shù)到聊天機(jī)器人,更多時候是用戶適應(yīng)它們的習(xí)性,而不是反過來適應(yīng)用戶的習(xí)性。 聊天機(jī)器人的回復(fù)“牛頭不對馬尾”是常有的事,受到環(huán)境影響發(fā)揮失常;受到噪音干擾發(fā)揮失常;深度算法的復(fù)雜性限制實(shí)際應(yīng)用等都是亟待解決的問題。 比如“雞尾酒會效應(yīng)”人類可以在諸多人的講話中屏蔽掉次重點(diǎn),捕捉最想聽到的信息。而機(jī)器人面對嘈雜的語音技術(shù)怎么分出個主次搜索到有用信息?從目前市場上的聊天機(jī)器人來看,在噪音處理環(huán)節(jié)并沒有很理想。 對于復(fù)雜的語音環(huán)境來講,本身就很難達(dá)到普適性的要求。語言作為人類的天賦能否被人工智能所真正理解和學(xué)習(xí),這將是語音交互中最難攻克的問題之一。而對于極度復(fù)雜“語義理解”和“語音識別”來說則很有可能掉入“雞和蛋”的怪圈。 “認(rèn)知方面的突破,現(xiàn)在還不知道猴年馬月?!闭Z音領(lǐng)域的權(quán)威專家黃學(xué)東坦言。 語音技術(shù)是在向移動客戶端叫板嗎? 剝開種種限制性條件,語音技術(shù)將要馳騁何方?假如深度算法難題、噪音處理問題、語音理解問題被一一攻克,那么語音技術(shù)將要接誰的盤? PC時代我們更多使用文字,而移動時代,隨著語音技術(shù)的發(fā)展,我們將更少使用鍵盤(實(shí)體和虛擬),更多地使用語音與機(jī)器自然交互。隨著語音技術(shù)的不斷成熟,承載大批量APP的移動客戶端則有可能走向消亡。 科技巨頭搶灘智能語音市場,能否改變?nèi)伺c機(jī)器語音市場方式?(圖4) 比如:打車軟件、叫外賣、網(wǎng)上購物、播放音頻視頻文件……只需要你語音指示,后臺便可以執(zhí)行所有命令!就像可以幫你打電話的Siri,未來或許你只需要一個很小巧的隨身裝置,就像“借東西的阿莉埃蒂小人” 一樣,可以與你并肩作戰(zhàn),聽得懂你的話,成為你耳朵、眼鏡、四肢的延伸與萬物互聯(lián)。 這不是科幻片或者動漫里的專屬場景,在數(shù)據(jù)資源、計算資源和算法技術(shù)的合力推動下,這一切都將可能成為現(xiàn)實(shí)。正如語音識別領(lǐng)域的技術(shù)大咖黃學(xué)東所言: “語音交互的發(fā)展是一個自然的過程,這是因?yàn)檎Z音交互是一個無需觸碰設(shè)備即可完成的體驗(yàn),它可以讓人擺脫設(shè)備的枷鎖?!? 從黃學(xué)東的論點(diǎn)中語音概念再一次被升華,也就是語音技術(shù)發(fā)展的終極意義:從根本上改變?nèi)藗兣c機(jī)器交互的方式。 筆者來看,語音技術(shù)之于移動客戶端,正如智能觸屏之于物理鍵盤,只要發(fā)展夠成熟,取代也只是時間問題。而目前我們更像是站在這個劃時代的轉(zhuǎn)折點(diǎn)上,一次徹底的跨越來源于更替技術(shù)的徹底醇熟,目前來看火候未到。  

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

相關(guān)文章