玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當(dāng)前的位置: 首頁 > 新聞 > 其他

GMIC百度云計算劉煬介紹:云上的大數(shù)據(jù)和人工智能

來源: 編輯:vbeiyou 時間:2016-04-29 10:12人閱讀
非常在線2016年4月29日消息,今天是GMIC全球移動互聯(lián)網(wǎng)大會的第二天,今天上午,百度云計算事業(yè)部總經(jīng)理劉煬關(guān)于云上的大數(shù)據(jù)和人工智能做了介紹,嘉賓對于云和大數(shù)據(jù)對此有了更多的了解,以下為演講內(nèi)容: 各位嘉賓上午好! 首先,非常感謝大家這么早的時間能夠趕到這個會場來參加這個云和大數(shù)據(jù)的峰會,我來自百度開放云,百度開放云是百度推出公有云的服務(wù),今天介紹的是云上的大數(shù)據(jù)和人工智能。大家知道MIT從2001年開始發(fā)布十大突破技術(shù),今年在中美兩地同時發(fā)布信息,今年2016年發(fā)布的十大突破性技術(shù)包括免疫工程、植物基因、語音接口、可回收火箭、分享機(jī)器人、DNA數(shù)據(jù)、Slack通信軟件、空中取電等等,所有這些技術(shù)上的突破本質(zhì)上來講毫無疑問,背后都有云和大數(shù)據(jù)支撐。但是仔細(xì)一點看,我們發(fā)現(xiàn)其中有七項基本上直接跟大數(shù)據(jù)和人工智能相關(guān),基因大家知道,一個人的基因測序200級以上的數(shù)據(jù),這些數(shù)據(jù)進(jìn)行無數(shù)的匹配和壓縮這些都是非常計算的。今天來講,生物工程已經(jīng)變成了一個信息產(chǎn)業(yè)所以這十大里面其中就有三項其實是跟基因產(chǎn)業(yè)相關(guān)的,是非常大數(shù)據(jù)的產(chǎn)業(yè)。 GMIC百度云計算劉煬介紹:云上的大數(shù)據(jù)和人工智能(圖1) 另外,像自動駕駛、語音接口和分享機(jī)器人,毫無疑問都是人工智能,我們看到今天來講大數(shù)據(jù)和人工智能已經(jīng)處在科技突破的最前沿,非常榮幸百度作為唯一上榜的中國企業(yè),百度在語音接口這個領(lǐng)域的世界領(lǐng)先地位被MIT的十大技術(shù)突破所認(rèn)可。 剛才講了大數(shù)據(jù)和人工智能,大數(shù)據(jù)是什么情況呢?大數(shù)據(jù)起源于搜索和廣告,百度和谷歌積累了大量的大數(shù)據(jù)能力,大數(shù)據(jù)已經(jīng)到了積累期,很多技術(shù)已經(jīng)突破了,大數(shù)據(jù)已經(jīng)開始超出了最開始產(chǎn)生大數(shù)據(jù)的領(lǐng)域,超出了搜索和廣告的領(lǐng)域,在越來越復(fù)雜的業(yè)務(wù)場景中大范圍的應(yīng)用。比如說,百度外賣,但為什么我們可以把外賣做到中國最大的外賣平臺之一,原因其實百度外賣是基于百度大數(shù)據(jù),我們做的效率最高的調(diào)度。百度地圖,每天會查一下路況,我一看7點半鐘左右交通是非常好的,我就7點半出發(fā),8點鐘已經(jīng)很堵車了,寧愿早點走。百度金融,百度跟國金證券在一起,都標(biāo)志著大數(shù)據(jù)已經(jīng)過了當(dāng)年的技術(shù)突破期,今天大數(shù)據(jù)已經(jīng)進(jìn)入了實用期,各行各業(yè)都在大量的應(yīng)用大數(shù)據(jù),不光只是百度,所有的行業(yè),我們看到非常多的公司都是這樣。 人工智能,大家知道,其實不是一個新概念,60年以前人工智能的概念出來了,為什么這兩年人工智能的概念這么熱,核心的一點人工智能有巨大的突破在深度學(xué)習(xí)這個領(lǐng)域有一個巨大的突破。深度學(xué)習(xí)這個領(lǐng)域巨大突破到底意味著什么?這里有一張圖,橫軸是數(shù)據(jù)量,這個縱軸是效果,過去的繼續(xù)學(xué)習(xí)的技術(shù),隨著數(shù)量做的增加,效果就到瓶頸了,邊際效益遞減很快。而深度學(xué)習(xí)的突破在本質(zhì)來講,它跟過去繼續(xù)學(xué)習(xí)的方法最大的不同,深度學(xué)習(xí)隨著數(shù)量的增加不會遞減,遞減的臨界點遠(yuǎn)遠(yuǎn)比這個老的算法大,這意味著今天來講幾乎可以說只要你有更多的數(shù)據(jù),你就可以獲得更好的效果,大數(shù)據(jù)、云計算,所以今天來講深度學(xué)習(xí)已經(jīng)取得了很多的突破,但是不斷有新的研究進(jìn)來,基本上這是深度學(xué)體現(xiàn)的效果。 前面提到百度語音技術(shù)被MIT十大突破被認(rèn)可,傳統(tǒng)語音都是通過好幾步來進(jìn)行的,通過好幾步之后計算量大幅減少,傳統(tǒng)的算法所擅長的。今天百度語音技術(shù)已經(jīng)可以全面轉(zhuǎn)向深度學(xué)習(xí)的方法,也就是說通過一個很深的深度學(xué)習(xí)的網(wǎng)絡(luò)不需要區(qū)分所有的模型特點,來達(dá)到更好的效果。 大家都知道百度今年在無人駕駛上面的投入是非常多的,我們知道自動駕駛今天本質(zhì)上講就是人工智能技術(shù)的綜合運用,它的非常多的領(lǐng)域里面需要使用人工智能。語音識別、圖像識別、規(guī)劃行動、智能推薦、分析決策等等,這些都是在人工智能上有非常大的需求,我們現(xiàn)在為了做無人車建了世界上最大規(guī)模的深度學(xué)習(xí)的網(wǎng)絡(luò),萬億級的參數(shù)、千億級的樣本,規(guī)模不斷擴(kuò)大中。所以我們看到深度學(xué)習(xí)的突破其實是引領(lǐng)了人工智能下一個大的浪潮。 但是剛才也提到,深度學(xué)習(xí)的特點越來越多的數(shù)據(jù)有越來越多好的效果,越來越多的數(shù)據(jù)需要越來越多的計算,我們?nèi)斯ぶ悄艿耐黄茖Υ髷?shù)據(jù)和計算的需求遠(yuǎn)超想象。百度在這個上面其實經(jīng)歷了非常多的案例,比方說,百度做的語音Deepspeech,每天語音識別合成請求2.4億萬次,上千臺服務(wù)器,使用了上千個GPU+FPGA,GPC大家可能很熟悉,F(xiàn)PGA是一種新的硬件,過去更多應(yīng)用在通信的領(lǐng)域里面,今天FPGA開始在大數(shù)據(jù)、人工智能看到非常好的表現(xiàn),在百度大規(guī)模的應(yīng)用FPGA。 計算機(jī)視覺使用非常多了,百億級圖片、千億級非圖片數(shù)據(jù),10PB級別存儲,上千塊GPU。廣告點擊預(yù)估CTR,在百度推廣里面CTR技術(shù)是最核心的技術(shù),這也是千億級的樣本特征,我們超過一萬臺的機(jī)器事實上用在這個CTR運行在里面。萬臺級別的服務(wù)器集群在支持,很多的問題通過人工智能的方法可以得到大幅的提升,但另外也看到人工智能對云計算、大數(shù)據(jù)底層能力需求大幅提高。 百度今天已經(jīng)把人工智能這個方向抬到了公司級戰(zhàn)略的地位,為了支持百度人工智能的支持,百度在云計算這個平臺上有非常大的投入。今天這個平臺支撐著百度數(shù)十款的數(shù)據(jù),讓我們來看一下,百度的這些底層云技術(shù),這些黑科技都有什么?現(xiàn)在從下往上看,下面是數(shù)據(jù)中心,在數(shù)據(jù)中心領(lǐng)域我們現(xiàn)在支持模塊化數(shù)據(jù)中心建設(shè),百度有自建的數(shù)據(jù)中心,很多模塊都是在工廠里面建好搬過來一拼就可以用了,使得整個數(shù)據(jù)中心的設(shè)計、實施的速度可以大幅提高。我們現(xiàn)在在數(shù)據(jù)中心里面已經(jīng)使用離線高壓直流電,這個有什么好處呢?過去數(shù)據(jù)中心電的用量可能只能做到90%利用率,而在百度使用離線高壓直流以后可以做到99.5%,百度大量數(shù)據(jù)中心冷卻實現(xiàn)自然冷鏈的工作,平均年的POE做到1.22,這是非常低的一個值,在中國是第一的,連續(xù)兩年也是獲得中國數(shù)據(jù)中心協(xié)會的最佳能源節(jié)能獎的頒獎。 我們看到計算,剛才提到繼續(xù)學(xué)習(xí)這個領(lǐng)域?qū)τ嬎阋蠓浅8撸覀兪菄鴥?nèi)最大的GPU集群,百度跟很多廠商在一起,包括騰訊、阿里、電信運營商一起推整機(jī)柜的方案,百度是整機(jī)柜的領(lǐng)導(dǎo)者。在存儲領(lǐng)域做了高密度的存儲,這里面對很多要求非常高,我們在磁盤故障修復(fù)、故障預(yù)測做了非常多,50%以上的磁盤故障是自動修復(fù)的,我們對98%的磁盤故障可以提出事先的報警,在網(wǎng)絡(luò)領(lǐng)域我們自研了交換機(jī),在軟件定義網(wǎng)絡(luò)方面做得非常多,現(xiàn)在百度全部萬兆的網(wǎng)絡(luò)接入,這是數(shù)據(jù)中心內(nèi)網(wǎng),我們支持TB級的跨IDC的數(shù)據(jù)。所有這些是硬件層的規(guī)模做得再大,如果沒有軟件層的調(diào)度是沒有用的,在分布式系統(tǒng)方面,百度天生是一個分布式的公司,在這個領(lǐng)域做了非常多的事情的今天Hadoop單集群1.5萬臺,我們的在離線的業(yè)務(wù)很多,今天很多公司在線是在線,離線是在線,在線服務(wù)用戶快速的,離線做大數(shù)據(jù)處理的,都是分開的。所以今天整個百度數(shù)據(jù)中心所有的機(jī)器合在一起CPU利用率可以做到50%以上,這是遠(yuǎn)超很多業(yè)界同類水平的。 為了支持百度云、百度網(wǎng)盤的產(chǎn)品我們支持EB級別的對象存儲,在結(jié)構(gòu)化存儲上面,我們搜索網(wǎng)頁全部是結(jié)構(gòu)化的存儲,這也是EB級別的結(jié)構(gòu)化存儲。所以百度在云計算基礎(chǔ)領(lǐng)域環(huán)節(jié)做了非常多的工作,只有做了這么多的工作才可以更好的支持上面人工智能、大數(shù)據(jù)對計算、對存儲、網(wǎng)絡(luò)的渴求。 最后做個廣告我們這些技術(shù)不管云計算的技術(shù)服務(wù)還是大數(shù)據(jù)、云計算,百度開放云這些百度推出公有云的服務(wù),我們?yōu)楦嗟男袠I(yè)應(yīng)用,包括媒體、營銷、物聯(lián)網(wǎng)、政企等等,我們更希望這些技術(shù)事實上可以幫助大家展開大家的想象力,你的需求是什么?我們希望釋放這技術(shù)的力量,通過技術(shù)能夠幫助大家去實現(xiàn)大家的想象力,實現(xiàn)大家的夢想。謝謝大家!

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

相關(guān)文章