玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當前的位置: 首頁 > 新聞 > 其他

終結閉源霸權 Meta Llama 3.1橫空出世!Intel第一時間適配并提供加速

來源:快科技 編輯:非小米 時間:2024-07-25 15:15人閱讀

快科技7月25日消息,日前Meta正式發(fā)布了Llama 3.1開源大模型,以其龐大的參數(shù)量和卓越性能,首次在多項基準測試中擊敗了GPT-4o等業(yè)界領先的閉源模型。

允許開發(fā)者自由地進行微調、蒸餾,甚至在任何地方部署,這種開放性為AI技術的普及和創(chuàng)新提供了無限可能。

Llama 3.1支持128k的上下文長度和多語言能力,無論是在基本常識、可操作性還是數(shù)學、工具使用和多語言翻譯方面,都展現(xiàn)出了行業(yè)領先的能力。

緊隨其后,芯片巨頭Intel迅速響應,宣布其AI產品組合已全面適配Llama 3.1,并針對Intel AI硬件進行了軟件優(yōu)化。

包括了數(shù)據(jù)中心、邊緣計算以及客戶端AI產品,確保用戶能夠在Intel平臺上獲得最佳的性能體驗。

Intel的適配工作涵蓋了PyTorch及Intel PyTorch擴展包、DeepSpeed、Hugging Face Optimum庫和vLLM等,確保了從研發(fā)到部署的全流程支持。

終結閉源霸權 Meta Llama 3.1橫空出世!Intel第一時間適配并提供加速

目前,Intel AI PC及數(shù)據(jù)中心AI產品組合和解決方案已面向全新Llama 3.1模型實現(xiàn)優(yōu)化,OPEA(企業(yè)AI開放平臺)亦在基于Intel至強等產品上全面啟用。

根據(jù)基準測試,在第五代Intel至強平臺上以1K token輸入和128 token輸出運行80億參數(shù)的Llama 3.1模型,可以達到每秒176 token的吞吐量,同時保持下一個token延遲小于50毫秒。

在配備了酷睿Ultra處理器和銳炫顯卡的AI PC上,進行輕量級微調和應用定制比以往更加容易,并且AI工作負載可無縫部署于CPU、GPU以及NPU上,同時實現(xiàn)性能優(yōu)化。

終結閉源霸權 Meta Llama 3.1橫空出世!Intel第一時間適配并提供加速
基于第五代Intel至強可擴展處理器的Llama 3.1推理延遲

終結閉源霸權 Meta Llama 3.1橫空出世!Intel第一時間適配并提供加速
在配備內置Intel銳炫顯卡的Intel酷睿Ultra 7 165H AI PC上,Llama 3.1推理的下一個token延遲

終結閉源霸權 Meta Llama 3.1橫空出世!Intel第一時間適配并提供加速
在使用Intel銳炫A770 16GB限量版顯卡的AI PC上,Llama 3.1推理的下一個token延遲

終結閉源霸權 Meta Llama 3.1橫空出世!Intel第一時間適配并提供加速
基于Llama 3.1的端到端RAG流水線,由Intel Gaudi 2加速器和至強處理器提供支持

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: Intel LLaMA

相關文章