7月6日,在2024世界人工智能大會(huì )期間舉辦的以“新AI·新應用·新生態(tài)”為主題的大模型論壇上,快手視頻生成大模型可靈、圖像生成大模型可圖的多項新功能正式發(fā)布。
論壇上,可靈推出更加清晰的高畫(huà)質(zhì)版,以及首尾幀控制、鏡頭控制等新功能,同時(shí),創(chuàng )作者單次生成的文生視頻時(shí)長(cháng)增加至10秒??蓤D則正式開(kāi)源,力求激發(fā)行業(yè)活力,共建一個(gè)更為繁榮的文生圖大模型社區生態(tài)。
快手高級副總裁、主站業(yè)務(wù)與社區科學(xué)線(xiàn)負責人蓋坤表示,未來(lái)將繼續加大在A(yíng)I領(lǐng)域的投入,大力推動(dòng)技術(shù)創(chuàng )新,“堅定地為用戶(hù)做最好的AI技術(shù)”。
用AI重塑內容理解、分發(fā)與生產(chǎn)環(huán)節
蓋坤介紹,快手搭建了以快意語(yǔ)言大模型、推薦大模型、視覺(jué)生成大模型為核心的大模型矩陣,其中,快手的推薦大模型SIM,具備十萬(wàn)億參數的規模。
“堅定大模型技術(shù)投入與創(chuàng )新,堅持在真場(chǎng)景中挖掘真價(jià)值,滿(mǎn)足用戶(hù)的真需求。”快手副總裁、大模型團隊負責人張迪表示,將用大模型技術(shù)重塑業(yè)務(wù),通過(guò)“升級理解、創(chuàng )新互動(dòng)、探索生成”,在內容生產(chǎn)方面,打造“新一代AIGC創(chuàng )作、素材工具”和低門(mén)檻、智能化的內容生產(chǎn)體驗;在內容消費領(lǐng)域,升級平臺的內容理解和分發(fā)體系,提升用戶(hù)消費體驗。
據了解,基于快意大模型構建的視頻腳本生成,直播實(shí)時(shí)腳本生成、廣告線(xiàn)索客服,疊加數字人技術(shù),助力商業(yè)化廣告主低成本生成高品質(zhì)的視頻和直播內容,提升線(xiàn)索轉化效率。
快手商業(yè)化外循環(huán)和AI商業(yè)產(chǎn)品負責人劉逍透露,半年來(lái),有近2萬(wàn)平臺商家借助大模型能力實(shí)現智能化經(jīng)營(yíng)。相比今年1月,今年6月的AIGC月活躍客戶(hù)數增長(cháng)了8倍。劉逍表示,磁力開(kāi)創(chuàng )、女?huà)z數字人、π數字員工等新工具將持續為商家深度賦能,創(chuàng )新和深化AI技術(shù)在商業(yè)化中的應用。
可靈AI上線(xiàn)首尾幀控制、鏡頭控制等新功能
本次論壇上,可靈AI基礎模型再升級,推出更加清晰的高畫(huà)質(zhì)版,以及首尾幀控制、鏡頭控制等全新編輯能力,同時(shí),創(chuàng )作者單次生成的文生視頻時(shí)長(cháng)增加至10s。
作為真正用戶(hù)可用的視頻生成大模型,可靈于6月6日正式發(fā)布文生視頻功能,隨后推出視頻續寫(xiě)等多項新功能,支持用戶(hù)最長(cháng)生成約3分鐘視頻??伸`以真實(shí)世界物理規則為基準,生成的視頻展現出電影級別的畫(huà)質(zhì)與動(dòng)態(tài)效果,甚至能夠模擬大幅度的物理運動(dòng),引發(fā)廣泛關(guān)注。
蓋坤介紹,截至目前,已有超過(guò)50萬(wàn)用戶(hù)申請可靈的內測資格,視頻生成數量達700萬(wàn)。團隊也將繼續提升模型基礎質(zhì)量,增強畫(huà)質(zhì)清晰度,并引入更多創(chuàng )新功能,以滿(mǎn)足用戶(hù)多樣化需求。
快手視覺(jué)生成與互動(dòng)中心負責人萬(wàn)鵬飛表示,最新發(fā)布的版本中,可靈在運動(dòng)生成、生成時(shí)長(cháng)、物理規律、視頻畫(huà)質(zhì)、指令響應、圖生視頻、視頻可控性等七方面的表現進(jìn)一步升級。
此外,為進(jìn)一步激發(fā)AI愛(ài)好者們的創(chuàng )作熱情,“靈”感迸發(fā)——首屆可靈AI x 快影視頻創(chuàng )作大賽在論壇上正式啟動(dòng)。
共建更繁榮的 文生圖大模型生態(tài)
在圖像生成大模型領(lǐng)域,可圖擁有多項核心優(yōu)勢,諸如強大的復雜語(yǔ)義理解能力、攝影級的畫(huà)面質(zhì)感、多條件的可控風(fēng)格化生成等。本次論壇上,可圖正式開(kāi)源。
值得注意的是,中國計算機學(xué)會(huì )(CCF)在論壇上宣布與快手共同成立“CCF-快手大模型探索者基金”,并同步開(kāi)啟基金申請通道。旨在應對AI技術(shù)迅猛發(fā)展的趨勢及業(yè)界對前沿技術(shù)的迫切需求,聚焦新一代大模型的關(guān)鍵技術(shù)研發(fā)。
據悉,雙方致力于深化學(xué)術(shù)研究與工業(yè)實(shí)踐的融合,共同培育大模型領(lǐng)域的科研及工程技術(shù)人才?;鹛貏e針對“大語(yǔ)言模型”“視覺(jué)理解與生成”“視頻處理大模型”“代碼大模型”以及“語(yǔ)音大模型”五大領(lǐng)域,于本年度推出共計12個(gè)研究項目,每項課題最高可獲30萬(wàn)元人民幣的支持。
(主辦方供圖)
(責任編輯:韓夢(mèng)晨)