售價超25萬元 NVIDIA最強顯卡H100刷新AI跑分記錄：近30倍領(lǐng)先

來源：快科技編輯：非小米時間：2023-06-28 10:06人閱讀

快科技6月28日消息，AI火爆之后，NVIDIA的顯卡成為香餑餑，尤其是高端的H100加速卡，售價超過25萬元依然供不應(yīng)求，而它的性能也非常夸張，最新的AI測試中全面刷新記錄，基于GPT-3的大語言模型訓(xùn)練任務(wù)紀(jì)錄已經(jīng)被刷至11分鐘。

機器學(xué)習(xí)及人工智能領(lǐng)域開放產(chǎn)業(yè)聯(lián)盟MLCommons公布了最新的MLPerf基準(zhǔn)評測，其中包括8個負載測試，LLM大語言模型中就有基于GPT-3開源模型的，很考驗平臺的AI性能。

參與測試的NVIDIA平臺由896個Intel至強8462Y+處理器和3584個H100加速卡組成，是所有平臺中唯一跑完所有測試的，而且刷新了記錄。

在關(guān)鍵的基于GPT-3的大語言模型訓(xùn)練任務(wù)中，H100平臺只用了10.94分鐘，可以對比的是Intel平臺，由96個至強8380處理器和96個Habana Gaudi2 AI芯片構(gòu)建的系統(tǒng)中，完成同樣測試的時間為311.94分鐘。

H100平臺的性能幾乎是30倍于Intel平臺，當(dāng)然兩套平臺的規(guī)模相差也很大，但只用768個H100加速卡的話，訓(xùn)練時間也只要45.6分鐘，依然遠超Intel平臺的AI芯片。

H100基于GH100 GPU核心，定制版臺積電4nm工藝制造，800晶體管，集成18432個CUDA核心、576個張量核心、60MB二級緩存，支持6144-bit HBM高帶寬內(nèi)存，支持PCIe 5.0。

H100計算卡有SXM、PCIe 5.0兩種樣式，其中SXM版本15872個CUDA核心、528個Tensor核心，PCIe 5.0版本14952個CUDA核心、456個Tensor核心，功耗最高達700W。

性能方面，F(xiàn)P64/FP32 60TFlops(每秒60萬億次)，F(xiàn)P16 2000TFlops(每秒2000萬億次)，TF32 1000TFlops(每秒1000萬億次)，都三倍于A100，F(xiàn)P8 4000TFlops(每秒4000萬億次)，六倍于A100。

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱：business@qudong.com

標(biāo)簽：英偉達 NVIDIA

玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片