玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當(dāng)前的位置: 首頁 > 新聞 > 科技

AI推理服務(wù)平臺升級,阿里云機器學(xué)習(xí)PAI推出新規(guī)格

來源:網(wǎng)絡(luò) 編輯:小編 時間:2023-04-04 14:33人閱讀

導(dǎo)語:

隨著生成式AI模型不斷拓寬AI應(yīng)用的場景邊界,模型在線服務(wù)的數(shù)量級快速增長,AI推理環(huán)節(jié)亟需精細(xì)化的資源管理。

近日,阿里云機器學(xué)習(xí)平臺PAI宣布全面升級模型服務(wù)平臺PAI-EAS,面向文圖生成、大語言模型等各類模型提供彈性穩(wěn)定的推理服務(wù),并推出全新規(guī)格GU30,與傳統(tǒng)規(guī)格相比價格平均優(yōu)惠45%。

全新推理規(guī)格GU30問世,釋放技術(shù)紅利

在AI工程化鏈路中,推理服務(wù)是打通“模型到應(yīng)用最后一公里”的重要環(huán)節(jié),并持續(xù)伴隨業(yè)務(wù)成長。

PAI-EAS是PAI推出的彈性推理服務(wù)平臺,提供異構(gòu)硬件 (CPU/GPU) 模型加載和服務(wù)部署,支撐達(dá)摩院、淘寶、高德等業(yè)務(wù)大量級模型服務(wù),并廣泛服務(wù)阿里云上企業(yè)客戶。結(jié)合推理優(yōu)化技術(shù)和云原生生態(tài),PAI-EAS進(jìn)一步提升異構(gòu)資源集群整體利用率,規(guī)?;貙崿F(xiàn)服務(wù)效率與性能提升,擴大讓利空間。

新推出的PAI-EAS GU30系列規(guī)格,專用于深度學(xué)習(xí)異構(gòu)推理場景,較PAI-EAS同等性能的傳統(tǒng)規(guī)格價格下降45%。

GU30可適配不同復(fù)雜程度的模型,支撐文圖生成、大語言模型、多模態(tài)模型、NLP、CV、ASR等的推理需求。付費模式上,EAS同時支持預(yù)付費和靈活的按量付費,用戶可以通過彈性擴縮容、彈性資源池等能力精細(xì)化地按需管控推理資源。

AI推理服務(wù)平臺升級,阿里云機器學(xué)習(xí)PAI推出新規(guī)格(圖1)


Serverless化覆蓋多樣推理場景

作為云上AI推理服務(wù)平臺,PAI-EAS在基礎(chǔ)設(shè)施層、容器調(diào)度層、模型部署層都提供豐富的產(chǎn)品功能,貼合不同場景的個性化需求。

實時同步推理場景,例如個性化推薦或類ChatGPT對話應(yīng)用等,用戶可通過一鍵壓測得到服務(wù)的QPS和時延閾值,并結(jié)合灰度發(fā)布和藍(lán)綠部署功能,在不影響線上業(yè)務(wù)的情況下進(jìn)行性能驗證并順滑切換。

近實時異步推理場景,例如文圖生成或視頻處理等,涉及較為復(fù)雜模型的推理,單次推理時間從十幾秒到幾十分鐘不等,PAI-EAS在推理服務(wù)內(nèi)部集成服務(wù)維度的消息隊列,并支持面向隊列長度實現(xiàn)推理的自動彈性擴縮容,滿足資源利用率提升及免運維需求。

離線批量推理場景,例如語音數(shù)據(jù)批量文本轉(zhuǎn)換等時延不敏感的場景,PAI-EAS可通過搶占型資源實例的方式幫助用戶控制批量推理成本。

AI推理服務(wù)平臺升級,阿里云機器學(xué)習(xí)PAI推出新規(guī)格(圖2)

PAI-EAS最新活動

從2023年4月中旬起,阿里云產(chǎn)品試用中心將正式開放PAI-EAS同等算力的試用規(guī)格,提供最長3個月的模型在線服務(wù)免費體驗包。點擊PAI-EAS產(chǎn)品頁官網(wǎng)(鏈接:https://www.aliyun.com/activity/bigdata/pai/eas),可在PAI-EAS產(chǎn)品官網(wǎng)獲得最新活動信息。

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: 阿里 阿里云

相關(guān)文章