
新浪科技訊 7月28日晚間消息,阿里繼上周阿里AI三連發(fā)后,宣布型阿里又扔出新的開源開源模型——電影級(jí)視頻生成模型通義萬(wàn)相Wan2.2。Wan2.2可將光影、電影色彩、頻模鏡頭語(yǔ)言三大電影美學(xué)元素裝進(jìn)模型,阿里隨意組合60多個(gè)直觀可控的宣布型參數(shù),大幅提升電影級(jí)畫面的開源制作效率。
目前,電影該模型單次可生成5s的頻模高清視頻,用戶可通過(guò)多輪提示詞進(jìn)一步完成短劇制作,阿里未來(lái)通義萬(wàn)相還將繼續(xù)提升單次視頻生成的宣布型時(shí)長(zhǎng),讓視頻創(chuàng)作更高效。開源
據(jù)悉,電影Wan2.2此次開源了文生視頻(Wan2.2-T2V-A14B)、頻模圖生視頻(Wan2.2-I2V-A14B)和統(tǒng)一視頻生成(Wan2.2-TI2V-5B)三款模型,其中文生視頻模型和圖生視頻模型均為業(yè)界首個(gè)使用MoE架構(gòu)的視頻生成模型,總參數(shù)量為27B,激活參數(shù)14B,均由高噪聲專家模型和低噪專家模型組成,分別負(fù)責(zé)視頻的整體布局和細(xì)節(jié)完善,在同參數(shù)規(guī)模下,可節(jié)省約50%的計(jì)算資源消耗,有效解決視頻生成處理Token過(guò)長(zhǎng)導(dǎo)致的計(jì)算資源消耗大問(wèn)題,同時(shí)在復(fù)雜運(yùn)動(dòng)生成、人物交互、美學(xué)表達(dá)、復(fù)雜運(yùn)動(dòng)等維度上也取得了顯著提升。
此外,Wan2.2還首創(chuàng)了電影美學(xué)控制系統(tǒng),光影、色彩、構(gòu)圖、微表情等能力媲美專業(yè)電影水平。例如,用戶輸入黃昏、柔光、邊緣光、暖色調(diào)、中心構(gòu)圖等關(guān)鍵詞,模型可自動(dòng)生成金色的落日余暉的浪漫畫面;使用冷色調(diào)、硬光、平衡圖、低角度的組合,則可以生成接近科幻片的畫面效果。(文猛)
海量資訊、精準(zhǔn)解讀,盡在新浪財(cái)經(jīng)APP 責(zé)任編輯:何俊熹