玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

摩爾線程萬卡GPU集群新進展！性能可提升20倍

來源：快科技編輯：非小米時間：2024-07-18 23:40人閱讀

快科技7月18日消息，摩爾線程官方宣布，與清華系AI系統(tǒng)軟件公司清程極智正式建立戰(zhàn)略合作關系，旨在加速國產大規(guī)模GPU智算集群的產業(yè)化進程，推動AI算力生態(tài)的快速發(fā)展，為大模型行業(yè)提供更強大、靈活且高效的基礎設施支持。

摩爾線程近期宣布了從千卡至萬卡的全功能GPU智算集群擴展方案，雙方此番合作就將聚焦于萬卡級超大規(guī)模GPU智算集群的開發(fā)與優(yōu)化。

清程極智是一家致力于構建高效人工智能系統(tǒng)軟件，賦能國產算力，支撐大模型行業(yè)發(fā)展的公司，自主研發(fā)了智能編譯器IntelliGen、高效并行訓練系統(tǒng)FastMoE，能夠顯著加速Transformer類模型和混合專家MoE模型的處理速度，部分模型性能提升最高可達15-20倍。

目前，清程極智的核心產品已全面適配摩爾線程自研的MUSA平臺。

摩爾線程還宣布，已與北京智源人工智能研究院順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。

利用摩爾線程自研的統(tǒng)一系統(tǒng)計算架構MUSA，雙方只用了短短一個多星期，就成功完成了近60個算子的功能驗證，精度符合交付標準，并實現(xiàn)了對Bert-large模型的全面支持。

摩爾線程研發(fā)團隊經過充分調研論證，還形成了Triton編譯器在MUSA架構上適配的完整方案，力求實現(xiàn)開發(fā)者在基于摩爾線程全功能GPU進行Triton開發(fā)算子過程中，也能獲得與原來一致的體驗，做到CUDA框架、MUSA框架的無縫遷移。

在摩爾線程MUSA架構上，F(xiàn)lagGems算子庫展現(xiàn)出了接近手寫算子的計算性能，而且性能還在持續(xù)調優(yōu)，極大加速了開源大模型在摩爾線程全功能GPU上的部署速度。

智源研究院是北京市于2018年11月推動成立的新型研發(fā)機構，核心目標是聚焦AI原始創(chuàng)新和核心技術，推動AI理論、方法、工具、系統(tǒng)和應用取得變革性、顛覆性突破，支撐北京建設成為全球AI學術思想、基礎理論、頂尖人才、企業(yè)創(chuàng)新和發(fā)展政策的源頭。

智源研究院的FlagGems算子庫是一個使用Triton編程語言實現(xiàn)的高性能通用算子庫，旨在為大語言模型提供一系列可應用于PyTorch框架的算子，加速模型的推理與訓練，降低新算法的開發(fā)門檻。

它以Triton編程語言的易用性和編譯器的標準接口為基礎，為多元芯片提供了一套易適配、高性能的算子解決方案，推動基于Triton的統(tǒng)一、開源的軟硬件生態(tài)建設。

摩爾線程萬卡GPU集群新進展！性能可提升20倍