Intel大型神經(jīng)擬態(tài)系統(tǒng)Hala Point集成11.5億神經(jīng)元:可比人腦快200倍
快科技4月18日消息,Intel正式發(fā)布了代號“Hala Point”的新一代大型神經(jīng)擬態(tài)系統(tǒng),用于類腦AI領(lǐng)域的前沿研究,提升AI的效率和可持續(xù)性。
該系統(tǒng)基于Intel Loihi 2神經(jīng)擬態(tài)處理器,在上代大規(guī)模神經(jīng)擬態(tài)研究系統(tǒng)“Pohoiki Springs”的基礎(chǔ)上,進一步改進了架構(gòu),將神經(jīng)元容量提高了10倍以上,達到史無前例的11.5億個,大致相當于貓頭鷹或卷尾猴的大腦皮層規(guī)模,性能也提高了多達12倍。
Loihi 2處理器早在2021年就已發(fā)布,首發(fā)采用Intel 4工藝,集成230億個晶體管、六個低功耗x86核心、128個神經(jīng)形態(tài)核心,單顆就有100萬個神經(jīng)元、1.2億個突觸,是上代規(guī)模的8倍,性能也提升了10倍。
Loihi 2應(yīng)用了眾多類腦計算原理,如異步、基于事件的脈沖神經(jīng)網(wǎng)絡(luò)(SNN)、存算一體不斷變化的稀疏連接,而且神經(jīng)元之間能夠直接通信,不需要繞過內(nèi)存。
尤其是在新興的小規(guī)模邊緣工作負載上,它實現(xiàn)了效率、速度和適應(yīng)性數(shù)量級的提升。
比如執(zhí)行AI推理負載和處理優(yōu)化問題時, Loihi 2的速度比常規(guī)CPU和GPU架構(gòu)快多達50倍,能耗則只有百分之一。
Hala Point系統(tǒng)的形態(tài)是一個六機架的數(shù)據(jù)中心機箱,大小相當于一個微波爐,內(nèi)置1152顆Loihi 2處理器,共有140544個神經(jīng)形態(tài)處理內(nèi)核、11.5億個神經(jīng)元、1280億個突觸,最大功耗僅為2600瓦。
系統(tǒng)內(nèi)還有2300多顆嵌入式x86處理器,用于輔助計算。
內(nèi)存帶寬達16PB/s(16000TB/s),內(nèi)核間通信帶寬達3.5PB/s(3500TB/s),芯片間通信帶寬達5TB/s,可以每秒處理超過380萬億次的8位突觸運算、超過240萬億次的神經(jīng)元運算。
Hala Point在主流AI工作負載上的計算效率非常出色,比如運行傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò)時,每秒可完成多達2萬萬億次運算(20PFlops),8位運算的能效比達到了15TOPS/W(每瓦特15萬億次計算),相當于甚至超過了基于GPU、CPU的架構(gòu)。
在用于仿生脈沖神經(jīng)網(wǎng)絡(luò)模型時,Hala Point能夠以比人腦快20倍的實時速度,運行其全部11.5億個神經(jīng)元。
尤其是在運行神經(jīng)元數(shù)量較低的情況下,它的速度甚至可比人腦快200倍!
早期研究結(jié)果表明,通過利用稀疏性高達10比1的稀疏連接和事件驅(qū)動的活動,Hala Point運行深度神經(jīng)網(wǎng)絡(luò)的能效比可高達15TOPS/W,同時無需對輸入數(shù)據(jù)進行批處理。
Hala Point系統(tǒng)有望推動多領(lǐng)域AI應(yīng)用的實時持續(xù)學習,比如科學研究、工程、物流、智能城市基礎(chǔ)設(shè)施管理、大語言模型、AI助手等等。
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com