玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當(dāng)前的位置: 首頁 > 新聞 > 其他

回顧NVIDIA GTC 2024:Blackwell算力核彈問世

來源:太平洋科技   編輯:非小米 時間:2024-03-21 23:48人閱讀

AI,這個在2023年猶如井泉噴涌進(jìn)我們?nèi)粘I畹脑~語,現(xiàn)如今正以驚人的速度重塑著我們的生活方式,同時間改變著整個世界的面貌。從大語言LLMs模型到先進(jìn)的AI圖像生成,從智能算法推薦到驚人的AI視頻生成,人工智能的觸角已經(jīng)伸展到了科技的各個角落。

從GPT-4發(fā)布,到谷歌Bard的入場、Meta開源模型LLama的問世,再到國內(nèi)文心一言、星火大模型、通義千問、月之暗面等諸多國產(chǎn)模型的紛紛亮相。我們目睹了全球人工智能領(lǐng)域的快速發(fā)展和技術(shù)突破。

如今AI的競爭依然處于百花齊放百家爭鳴的階段,每一家都在使用自身優(yōu)勢在AI浪潮中分得一杯羹。從北美的硅谷到歐洲的科技集群,從亞洲的研發(fā)中心到其他地區(qū)的創(chuàng)新孵化器,AI正在成為跨國界、跨文化的合作與競爭的焦點。

若將人工智能比作科技高峰上的璀璨之花,那么NVIDIA無疑是這些花朵賴以綻放的肥沃土壤。正是NVIDIA提供的先進(jìn)計算平臺,成為滋養(yǎng)人工智能之林的關(guān)鍵養(yǎng)分,讓這些技術(shù)之花競相開放,展現(xiàn)出驚世之美。

2024 NVIDIA GTC主題演講 見證 AI 的變革時刻

每年春季,NVIDIA的GTC主題演講就如約而至。自2019年以“GPU Computing: The Future of Computing”揭開序幕,AI便成了GTC年會的重頭戲。NVIDIA始終致力于將旗下產(chǎn)品的強大算力與AI技術(shù)的前沿需求無縫對接。正是老黃遠(yuǎn)見卓識的策略布局,使NVIDIA在AI的黃金時代巍然屹立,穩(wěn)占行業(yè)霸主之位。

2023年,老黃在演講中詳細(xì)闡述了NVIDIA在人工智能、數(shù)據(jù)中心、云計算等關(guān)鍵領(lǐng)域取得的最新成果。

重點介紹了NVIDIA Hopper GPU架構(gòu),它使AI性能相比前一代產(chǎn)品實現(xiàn)了翻倍的飛躍。同時,NVIDIA DGX Cloud為企業(yè)級用戶帶來了前所未有的強大算力支持。

而NVIDIA Omniverse平臺則將AI技術(shù)的應(yīng)用拓展到了設(shè)計和建筑行業(yè)。老黃在演講中富有預(yù)見性地指出:我們現(xiàn)在正處在人工智能的‘iPhone時代’。

那么在今天的GTC大會上,老黃,這位“人類AI教父”又給我們帶來了什么新鮮事呢?

Blackwell 2080億晶體管的算力猛獸

當(dāng)下,世界范圍內(nèi)使用最多的AI應(yīng)用-LLMs,如Google的Gemini、Meta的NLLB、Maxtral的Mistral以及OpenAI的GPT-4等模型,均采用了“專家混合”(Mixtures of Experts,MoEs)技術(shù)。這些模型功能的強大,對芯片硬件提出了更高的要求。2023年,NVIDIA 憑借其Hopper架構(gòu),成功地迎接了這些挑戰(zhàn)。

在今年的GTC上,老黃再一次地刷新了世界AI商用算力的排行榜,發(fā)布了Blackwell 架構(gòu)和同名AI處理器B100、B200和GB200,產(chǎn)品取名自杰出數(shù)學(xué)家和統(tǒng)計學(xué)家 David H. Blackwell,體現(xiàn)了其在概率計算、博弈論、統(tǒng)計學(xué)和動態(tài)規(guī)劃等多個領(lǐng)域的杰出貢獻(xiàn)。

此次發(fā)布的 Blackwell GPU B100使用了兩個臺積電4NP工藝制造的芯片,芯片面積為814平方毫米,這個數(shù)據(jù)已經(jīng)接近了EUV光刻技術(shù)的理論極限值(858平方毫米),兩個芯片通過C2C-Interface進(jìn)行相連,組成一個“1600平方毫米”的超大處理單元。

單個GPU芯片含1040億晶體管,整體達(dá)到2080億個,比上一代的Hopper架構(gòu)增加了240億個。每個GPU連接了四個各有24GB的HBM3E存儲芯片,使得B100 AI處理器擁有192GB的高速存儲,并且存儲帶寬達(dá)到了8TB/s。

回顧NVIDIA GTC 2024:Blackwell算力核彈問世

B100/B200/H100/AMDMI300X AI處理器重點參數(shù)對比 圖片源自于網(wǎng)絡(luò)

在計算性能方面,NVIDIA 目前主要公布了 Blackwell 架構(gòu)中 Tensor Cores 的性能數(shù)據(jù)。對比 NVIDIA Hopper架構(gòu)的數(shù)據(jù)顯示,對于低精度計算,Blackwell GPU 的性能是前代的2.5倍。

而針對 FP64 計算,性能從 67 TFLOPS 降低至 30 TFLOPS。對此,NVIDIA并沒有進(jìn)行解釋,許多博主也對FP64精度計算性能的下降表示了疑惑。

回顧NVIDIA GTC 2024:Blackwell算力核彈問世

在日常的計算任務(wù)中,F(xiàn)P32(單精度浮點數(shù))和FP64是最為普遍的數(shù)據(jù)格式,它們使用32位和64位分別對浮點數(shù)進(jìn)行編碼,既能提供較大的數(shù)值范圍也保障了較高的數(shù)值精度,但相對地,也對內(nèi)存和計算資源的需求更高。

與之相對,F(xiàn)P16(半精度浮點數(shù))和FP4提供的算力精度較低,特別是FP4,其低精度下的性能并不理想,即使在大型語言模型(LLMs)中開啟FP4精度運行也是如此。

回顧NVIDIA GTC 2024:Blackwell算力核彈問世

尚不明確NVIDIA此次為何將主要升級焦點放在FP4運算上。隨著針對移動端LLMs需求的增長,對FP4運算的依賴可能有所增加,這或許促使NVIDIA優(yōu)化了對FP4的支持,以提升這些應(yīng)用的運算效率。

功耗方面,NVIDIA 宣布 Blackwell 系列的TDP范圍在 700 至 1200 W之間。其中,風(fēng)冷版本的 B100 和 B200 的 TDP 分別為 700W和 1000 W,而 1200 W版本的則需使用上水冷散熱。此外,Blackwell GPU 還配備了支持 6.0 標(biāo)準(zhǔn)的 PCI-Express 控制器。

然后也放一下B100和B200的對比圖,B200在運算性能與顯存上對比B100有了不小的提升,相當(dāng)于B100的“官方灰燼版”。同時NVIDIA還推出了GB200。

回顧NVIDIA GTC 2024:Blackwell算力核彈問世

GB200就是將2個B200芯片和1個GraceCPU整合到一起,“合體之后”的性能表現(xiàn)將是單片H100的30倍左右的提升。當(dāng)然GB200是應(yīng)該是不會單獨售賣的,如同去年推出的HGX 100 72X一樣,GB200主要還是通過整合,然后形成一個GB200 NVL72的計算中心進(jìn)行出售。

回顧NVIDIA GTC 2024:Blackwell算力核彈問世

回顧最近發(fā)布的Blackwell GPU,我認(rèn)為其最大亮點并非在于算力的顯著提升,而是它所搭載的192GB HBM 3E高帶寬存儲。面對如今日益增長的模型尺寸——例如,埃隆·馬斯克最近宣布開源的Grok-1模型,它至少需要800GB的顯存才能運行。

若使用H100 GPU(配備80GB顯存),運行該模型需要整整10張卡,而采用B100 GPU(如果每張配備192GB顯存),僅需4張便可滿足需求。這對于運維商而言,無疑是一種成本效率極高的解決方案。

這也是未來AI處理器發(fā)展的一個趨勢,為了更好地AMD 的 Instinct MI300 系列產(chǎn)品形成壓制。NVIDIA 還計劃在今年下半年為 H100 系列加速器增加新的 H200 或 GH200 代,這將提供更高的 141 GB HBM3E 存儲以及 4.8 TB/s 的存儲帶寬,也就是官方的顯存提升版本。

Omniverse 再升級,Vision Pro應(yīng)用新場景?

NVIDIA在本次的GTC 2024中進(jìn)一步升級了其Omniverse平臺,并將其企業(yè)技術(shù)擴展到了蘋果生態(tài)系統(tǒng)。這一策略在于借助Vision Pro應(yīng)用,使開發(fā)者得以在增強現(xiàn)實/虛擬現(xiàn)實(AR/VR)環(huán)境中利用Omniverse的強大工具。

在GTC大會上上,NVIDIA展示了設(shè)計師如何利用Vision Pro中的汽車配置工具操作車輛模型,并能夠以虛擬的方式“進(jìn)入”車輛內(nèi)部進(jìn)行查看。這種交互是通過Omniverse Cloud API實現(xiàn)的,此外,圖形內(nèi)容還可以通過云計算服務(wù)直接流式傳輸至Vision Pro,實現(xiàn)高效的圖形傳輸網(wǎng)絡(luò)服務(wù)。

這一升級意味著,Omniverse和Vision Pro的結(jié)合將為AR/VR領(lǐng)域帶來更加沉浸式和互動性強的體驗。用戶能夠在三維空間中以更加自然和直觀的方式進(jìn)行設(shè)計、模擬和創(chuàng)作,這對于產(chǎn)品設(shè)計、建筑可視化以及互動娛樂等多個應(yīng)用場景都將是一次質(zhì)的飛躍。

機器人的ChatGPT時代可能即將來臨

正當(dāng)我們以為今天的大會只會聚焦于算力話題時,老黃卻給我們帶來了意想不到的驚喜——備受矚目的年度機器人環(huán)節(jié)如約而至,NVIDIA宣布了其人形機器人項目GR00T。

在今日的主題演講中,黃仁勛展示了多款由GR00T平臺驅(qū)動的人形機器人如何高效完成多項任務(wù),這些機器人分別來自 Agility Robotics、Apptronik、傅利葉智能以及宇樹科技。

GR00T的誕生源自NVIDIA的Isaac機器人平臺工具,它基于全新的通用基礎(chǔ)模型設(shè)計,使得GR00T驅(qū)動的人形機器人能夠接收并處理文本、語音、視頻乃至現(xiàn)場示范的輸入信息,從而執(zhí)行精確的操作。這些操作包括理解自然語言、模仿人類行為、在現(xiàn)實世界中的導(dǎo)航和互動等??梢哉f,AI已經(jīng)變成了機器人的“靈魂”。

NVIDIA還開發(fā)了一款新型的“機器人大腦”計算芯片——Jetson Thor,該芯片能夠執(zhí)行復(fù)雜的任務(wù),并借助Transformer引擎處理多元的傳感器數(shù)據(jù)。

未來,NVIDIA將人形機器人定位為公司的一個關(guān)鍵戰(zhàn)略方向。正如黃仁勛所預(yù)示的,機器人界的ChatGPT時代可能即將來臨。

在過去,NVIDIA給人更多的印象就是一個游戲顯卡的制造商,很少有人能夠想到在不到20年的時間里,NVIDIA通過CUDA能夠讓GPU從一個“游戲硬件”概念變成一個改變世界的“數(shù)字石油”。

未來,隨著技術(shù)的不斷進(jìn)步,NVIDIA的GPU很可能繼續(xù)拓展其影響力。隨著量子計算、邊緣計算和物聯(lián)網(wǎng)的發(fā)展,NVIDIA的技術(shù)有望在新的領(lǐng)域中發(fā)揮關(guān)鍵作用,進(jìn)一步加速世界的數(shù)字化轉(zhuǎn)型。

回顧NVIDIA GTC 2024:Blackwell算力核彈問世

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: AI NVIDIA

相關(guān)文章