全新開源王者!NVIDIA悄然推出70B AI模型:力壓GPT-4o、僅次于OpenAI o1
快科技10月17日消息,今天,NVIDIA悄然開源了名為Nemotron-70B的AI模型。
這款模型一經(jīng)發(fā)布便在多個基準(zhǔn)測試中超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內(nèi)的140多個開閉源模型,僅次于OpenAI的最新模型o1。
對此AI社區(qū)驚呼,新的開源王者又來了?業(yè)內(nèi)更是表示,用Llama 3.1訓(xùn)出小模型吊打GPT-4o,簡直是神來之筆。
從命名上可以看出,Nemotron-70B基于Llama-3.1-70B開發(fā),在沒有專門提示和額外推理token的情況下,Nemotron-70B也能答對復(fù)雜的推理問題,如“草莓有幾個r”的經(jīng)典難題。
業(yè)內(nèi)人士評價,NVIDIA在Llama 3.1基礎(chǔ)上訓(xùn)練出的這個不太大模型,能夠超越GPT-4o和Claude 3.5 Sonnet,是一次技術(shù)上的飛躍。
目前,Llama-3.1-Nemotron-70B-Instruct已經(jīng)可以在線體驗(yàn)。
此外,英偉達(dá)還開源了Nemotron的訓(xùn)練數(shù)據(jù)集 HelpSteer2,包括如下:
構(gòu)建了21362個提示響應(yīng),使模型更符合人類偏好,也更有幫助、更符合事實(shí)、更連貫,并且可以根據(jù)復(fù)雜度和詳細(xì)度進(jìn)行定制;
構(gòu)建了20324個用于訓(xùn)練的提示響應(yīng),1038個用于驗(yàn)證。
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com