玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當(dāng)前的位置: 首頁(yè) > 新聞 > 其他

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

來(lái)源:差評(píng)   編輯:非小米 時(shí)間:2024-10-18 01:00人閱讀

“ 疑似使用了AI 生成技術(shù),請(qǐng)謹(jǐn)慎甄別 ” 

大家有沒(méi)有發(fā)現(xiàn),這行小字有點(diǎn)像 “ 廣告僅供參考, 請(qǐng)以實(shí)物為準(zhǔn) ” ,已經(jīng)幾乎在生活中越來(lái)越常見(jiàn)了。

特別是現(xiàn)在的短視頻平臺(tái)。

刷到個(gè)小貓視頻,口型是 AI 合成的。

刷個(gè)西游記,也能看到 AI 妖精真身。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

甚至看一個(gè)動(dòng)畫片,畫面還總是 AI 合成的。

AI 視頻越來(lái)越多了。

雖然掀起 AI 視頻浪潮的 Sora 還在難產(chǎn),但 AI 視頻時(shí)代或許已經(jīng)悄然而至。

東吳證券的一份研報(bào)里就預(yù)測(cè),中國(guó) AI 視頻生成的潛在行業(yè)空間,可能擁有超過(guò) 5800 億元的市場(chǎng)。

但隨著市場(chǎng)不斷火熱,行業(yè)的一些問(wèn)題也逐漸暴露到公眾視野:

 視頻化和 AI 確實(shí)都是未來(lái),但像是成本問(wèn)題、質(zhì)量問(wèn)題、協(xié)同問(wèn)題和性能問(wèn)題,都縈繞在所有初創(chuàng)企業(yè),大廠們的心頭。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

就拿成本問(wèn)題和質(zhì)量問(wèn)題為例。

大家都知道,目前的生成式大模型特別是視頻,就是一個(gè)力大飛磚的過(guò)程,需要用海量數(shù)據(jù)進(jìn)行訓(xùn)練。

而超大規(guī)模視頻訓(xùn)練數(shù)據(jù),又會(huì)對(duì)計(jì)算和處理數(shù)據(jù)、以及數(shù)據(jù)本身有著天量需求,隨之而來(lái)的成本增加是一個(gè)天文數(shù)字。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

 GPT-4o 作為一個(gè)老款 AI ,開發(fā)成本 “ 僅 ” 為 1 億美元,訓(xùn)練成本大概在 7800 萬(wàn)美元左右。

而視頻模型的訓(xùn)練成本就更高了,以年初推出的視頻模型 Sora 為例,其訓(xùn)練和推理所需的算力需求,分別就達(dá)到了GPT-4 的 4.5 倍和近 400 倍。。。

除了天價(jià)訓(xùn)練成本外,大模型訓(xùn)練樣本質(zhì)量、處理鏈路復(fù)雜,涉及多個(gè)環(huán)節(jié),需要多團(tuán)隊(duì)協(xié)作;自研 / 第三方, GPU 、 CPU 、 ARM 等多種異構(gòu)算力資源,又需要靈活調(diào)度部署。。。

所以,對(duì)不少準(zhǔn)備擁抱 AI 視頻的公司們來(lái)說(shuō),當(dāng)務(wù)之急就是想盡辦法,解決這些問(wèn)題,才能更快地進(jìn)化。

 要論玩視頻的高手,抖音和火山引擎可就有話說(shuō)了。

上個(gè)月底字節(jié)推出的爆火的 PixelDance ,效果那是杠杠的。

我們當(dāng)時(shí)還寫了篇文章專門給大家嘮了遍,就看我們簡(jiǎn)單試用生成的視頻效果,就知道還真有點(diǎn)東西喔。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

而在 15 號(hào)結(jié)束的火山引擎視頻云技術(shù)大會(huì)上,開場(chǎng)用了定制數(shù)字人譚待來(lái)和大家溝通。

結(jié)果效果好到,現(xiàn)場(chǎng)參會(huì)者們,不少都以為這是視頻摳圖。

而這些高質(zhì)量 AI 產(chǎn)出背后,其實(shí)離不開一個(gè)叫 BMF 的智能框架。

火山引擎通過(guò)和自家大模型團(tuán)隊(duì)在內(nèi)部合作,一起把海量的視頻數(shù)據(jù)進(jìn)行預(yù)處理。

最后基于火山引擎音視頻處理平臺(tái)和 BMF 框架,在短時(shí)間內(nèi)生產(chǎn)了足夠多高質(zhì)量的視頻素材,用于模型的訓(xùn)練,才有了 PixelDance 。

功臣之一的 BMF ,為什么能夠做到這些呢?

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

我們用個(gè)生活中常見(jiàn)的例子來(lái)解釋:

一個(gè)公司開發(fā)大模型就好比你家做年夜飯。

為了吃上一頓豐盛的年夜飯,你爸爸負(fù)責(zé)買菜、媽媽燒飯、奶奶包餃子、你搬桌椅板凳。。。

所有人都得有分工,從頭忙到尾,可能還得時(shí)不時(shí)打個(gè)電話發(fā)個(gè)微信互幫互助,最后一算,好家伙,原來(lái)吃頓年夜飯還得花這么多錢。

 而 BMF 就是火山引擎推出的一個(gè) “ 年夜飯一鍵全流程套餐 ” ,它提供了一系列的工具和服務(wù),幫你輕松、快捷地準(zhǔn)備好年夜飯。

這個(gè)套餐重點(diǎn)針對(duì)性地解決了我們前面說(shuō)到的 4 個(gè)行業(yè)痛點(diǎn),進(jìn)行了相應(yīng)的調(diào)整。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

比如為了解決視頻訓(xùn)練數(shù)據(jù)質(zhì)量問(wèn)題,他們掏出了多種算法對(duì)視頻進(jìn)行多維度的分析和篩選,做到了充分精細(xì)化的過(guò)濾;

應(yīng)對(duì)性能難題,他們又利用 BMF 框架的靈活調(diào)度,提前調(diào)配好了性能。

這就相當(dāng)于準(zhǔn)備年夜飯一早就做好了攻略,買菜交給了多多買菜送貨上門、燒飯找了五星級(jí)大廚專門掌勺、桌椅板凳安排了專門的小工打雜。。。

 反正就是用了 BMF 這套框架,又便捷又省心又省錢。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

搞定了企業(yè)這邊的需求,火山引擎也沒(méi)忘了大家伙。

如今,大家設(shè)備的算力不斷上漲,與之而來(lái)的就是對(duì)視頻畫質(zhì)提升的強(qiáng)烈需求。

火山引擎通過(guò)得天獨(dú)厚的優(yōu)勢(shì),每天在抖音 / 西瓜等 app ,面對(duì)上億用戶,處理海量視頻圖片。

 獲得了這么豐富的經(jīng)驗(yàn)之后,火山引擎在 BMF 基礎(chǔ)上,沉淀出了一個(gè)更適合普通用戶體質(zhì)的 “BMF lite” ,實(shí)現(xiàn)了更輕量、更高效、更通用的進(jìn)化。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

比如相較于云端,在用戶端側(cè),對(duì)于功耗,內(nèi)存非常敏感,而場(chǎng)景又涉及 Android 、 ios 、 PC 等多平臺(tái)。

于是 BMF-Lite 就重點(diǎn)建設(shè)基于跨平臺(tái),資源復(fù)用的算法包的框架設(shè)計(jì)。

簡(jiǎn)單說(shuō)就是統(tǒng)一了各個(gè)平臺(tái)的接口形式,方便集成部署。

再用算法控制器來(lái)復(fù)用相同的算法實(shí)例,在抖音播放場(chǎng)景,點(diǎn)播跟直播播放大部分都是只會(huì)生效一個(gè),可以最大程度地復(fù)用資源。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

而除了 BMF 為代表的智能框架,火山引擎還提出了智能算力和智能編解碼。

火山引擎直接在去年掏出了一款自研視頻轉(zhuǎn)碼芯片,將自研的視頻編解碼技術(shù)融入到了里面。

好處就是,針對(duì)視頻點(diǎn)播、直播等特定場(chǎng)景,這款轉(zhuǎn)碼芯片有著更高的計(jì)算密度。

 就這么說(shuō)吧,一套視頻編解碼芯片服務(wù)器的轉(zhuǎn)碼能力,相當(dāng)于上百臺(tái) CPU 服務(wù)器。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

今天視頻轉(zhuǎn)碼芯片上線抖音后,通過(guò)實(shí)踐數(shù)據(jù)表明,在同等視頻壓縮效率下,成本能節(jié)省 95% 以上。

而針對(duì)編解碼層,火山引擎推出了基于自研視頻轉(zhuǎn)碼芯片構(gòu)建的 “BVE1.2 編碼器 ” 。

這個(gè)編碼器大膽融合了深度學(xué)習(xí)技術(shù),推出了革命性的智能混合編解碼解決方案,將傳統(tǒng)壓縮技術(shù)與深度學(xué)習(xí)壓縮技術(shù)有機(jī)融合成為一個(gè)整體,極大地提升了編解碼的效率,提升了編碼性能。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

在前不久結(jié)束的的第六屆深度學(xué)習(xí)圖像壓縮挑戰(zhàn)賽( CLIC 大賽 )中, “BVE1.2 編碼器 ” 拿到兩個(gè)冠軍足以說(shuō)明實(shí)力。

這一套小組合拳下來(lái),感覺(jué)有興趣的廠商們,估計(jì)滿腦子都是 “ 付款碼掃哪兒 ” ?

你還別說(shuō),火山引擎也的確沒(méi)打算藏著掖著。

 像前面說(shuō)的 BMF 框架,早在去年就已經(jīng)開源了,更新完的 BMF lite ,也是直接開源。

到處都能刷到的AI視頻 真沒(méi)你想的那么簡(jiǎn)單

總的來(lái)說(shuō),目前,大模型的進(jìn)化還在持續(xù),視頻 AI 公司之間的競(jìng)爭(zhēng)也只會(huì)日益激烈。

但如果大家只是閉門造車,互相拿成果比拼,用產(chǎn)品說(shuō)話,可能會(huì)顯得競(jìng)爭(zhēng)有余、合作不足。

而作為可能是全中國(guó)短視頻玩得最熟練的字節(jié)跳動(dòng),他們旗下的火山引擎一次次地將內(nèi)部技術(shù)、框架開源。

特別帶來(lái)的 BMF 框架以及它和智能算力和智能編解碼組成的一整套智能底座,的確能夠幫助企業(yè)們節(jié)約了大量時(shí)間和成本,更好地幫助 AI 項(xiàng)目落地發(fā)展。

這種競(jìng)爭(zhēng)和合作共存的態(tài)度,才是中國(guó) AI 最樂(lè)意見(jiàn)到的場(chǎng)面。

一枝獨(dú)秀難成林,萬(wàn)紫千紅才是春。

本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: 視頻 AI

相關(guān)文章