玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當(dāng)前的位置: 首頁 > 新聞 > 其他

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

來源:快科技 編輯:非小米 時間:2023-06-28 16:15人閱讀

快科技6月28日消息,今天,機器學(xué)習(xí)與人工智能開放產(chǎn)業(yè)聯(lián)盟MLCommons公布了AI性能基準(zhǔn)測試MLPerf Training 3.0的結(jié)果,Intel旗下的Habana Gaudi2深度學(xué)習(xí)加速器、第四代至強可擴展處理器聯(lián)合,展現(xiàn)出了優(yōu)秀的性能。

可以說,Intel這套組合已經(jīng)成為唯一能夠可靠取代NVIDIA GPU的方案。

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

MLPerf是目前最具信服力的AI性能測試基準(zhǔn),能夠在各種解決方案之間進行公平、可重復(fù)的性能比較。

目前,Intel已經(jīng)擁有超過100次的MLPerf性能測試結(jié)果,而且是唯一一個使用行業(yè)標(biāo)準(zhǔn)的深度學(xué)習(xí)生態(tài)系統(tǒng)軟件,并公開提交CPU結(jié)果的廠商。

根據(jù)業(yè)內(nèi)當(dāng)前的普遍觀點,生成式AI和大語言模型(LLM)只適合在高性能GPU上運行,但最新數(shù)據(jù)顯示,基于Intel CPU、加速器的組合方案,同樣有著極高的效率,而且是開放生態(tài)環(huán)境,效率與規(guī)模不受限制,從而為客戶提供極具競爭力的選擇。

其中,第四代可擴展至強內(nèi)置的各種加速器,使其成為在通用CPU處理器上運行大量AI工作負載的理想解決方案,Gaudi則在生成式AI、LLM方面有著優(yōu)秀的性能,此外Intel還提供了經(jīng)過優(yōu)化的、易于編程的開放軟件,降低AI部署門檻。

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了
Habana Gaudi2夾層卡

最新的MLPerf 3.0測試結(jié)果顯示,面對要求極為苛刻的、1750億參數(shù)的GPT-3模型,Habana Gaudi2的性能非常出色,可擴展性也非常靈活:

1、384個加速器上的訓(xùn)練時間僅為311.9分鐘——512個NVIDIA H100加速器需要64.3分鐘。

2、256個加速器到384個加速器,性能擴展95%,接近線性提升。

3、在計算機視覺模型ResNet-50(8個加速器)和Unet3D(8個加速器),以及自然語言處理模型BERT(8個和64個加速器)上,都取得了優(yōu)異的訓(xùn)練結(jié)果。

4、與去年11月提交的數(shù)據(jù)相比,BERT和ResNet模型的性能分別提高了10%、4%。

5、支持“開箱即用”,客戶在本地或在云端使用Gaudi2時,可以獲得與本次測試相當(dāng)?shù)男阅芙Y(jié)果。

值得一提的是,Gaudi2是僅有的兩個向GPT-3大模型訓(xùn)練基準(zhǔn)提交性能結(jié)果的解決方案之一。

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

軟件層面,本次提交的GPT-3模型基于PyTorch,并采用了當(dāng)前流行的、隸屬微軟大規(guī)模AI的DeepSpeed優(yōu)化庫,而非定制軟件。

DeepSpeed能夠同時支持Data、Tensor、Pipeline的三維并行,進一步優(yōu)化了大語言模型的擴展性能效率。

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

本次MLPerf 3.0的Gaudi2結(jié)果以BF16數(shù)據(jù)類型提交,在四種不同模型上的性能均優(yōu)于NVIDIA A100,價格更便宜。

第三季度還會發(fā)布對FP8數(shù)據(jù)類型的軟件支持與新功能,預(yù)計屆時Gaudi2的性能將有明顯飛躍,預(yù)計性價比將超越NVIDIA H100。

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

Intel可擴展至強則是向MLPerf 3.0提交的眾多解決方案中,唯一基于CPU通用處理器的,也支持“開箱即用”,即在通用系統(tǒng)上部署AI。

MLPerf 3.0四代可擴展至強測試的亮點有:

1、在封閉區(qū),47.93分鐘的訓(xùn)練時間即可完成BERT模型,88.17分鐘即可完成ResNet-50模型。

2、多節(jié)點擴展可以實現(xiàn)幾乎線性的性能提升,可達97-100%。

3、BERT模型的開放區(qū)擴展至16個節(jié)點時,31.06分鐘即可完成模型訓(xùn)練。

4、對于較大的RetinaNet模型,16個節(jié)點上的訓(xùn)練時間僅為232分鐘。

5、基于Intel AMX高級矩陣擴展,可提供顯著的“開箱即用”性能提升,覆蓋多個框架、端到端數(shù)據(jù)科學(xué)工具,以及廣泛的智能解決方案生態(tài)系統(tǒng)。

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

Intel還對比了至強鉑金8480+、NVIDIA A100使用不同數(shù)據(jù)集完成HuggingFace Distilbert模型的結(jié)果,分別只需3.61分鐘、0.7分鐘。

雖然相比對手的1.49分鐘、0.45分鐘還有差距,但速度已經(jīng)相當(dāng)快,尤其是作為通用CPU對比專用GPU達到如此程度,實屬不易,這都得益于Intel良好、深入的系統(tǒng)優(yōu)化。

唯一可靠替代NVIDIA!Intel至強CPU、Gaudi2加速器AI組合做到了

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: Intel 英偉達 NVIDIA

相關(guān)文章