繼Runway、Pika、字節(jié)PixelDance、萬興“天幕”發(fā)布,2月16日凌晨,“王炸”模型Sora橫空出世,AI視頻生成迎來“GPT時刻”。
在Open AI公布的48個樣片中,Sora展現(xiàn)出令人驚嘆的視頻生成效果,視頻時長提升至1分鐘,生成的角色表情逼真,還實現(xiàn)了多角度鏡頭切換與流暢分鏡,可展現(xiàn)真實光影、運動和鏡頭移動效果。
據(jù)了解,Sora是一個擴散Transformer模型,通過采用Diffusion Transformer等技術處理不同持續(xù)時間、分辨率和比例的視頻/圖像,實現(xiàn)“世界模擬器”,達到理解真實世界的運動和物理能力。
對比Runway、Pika等玩家,Sora的特別之處在于,它能夠理解和模擬真實世界,從而生成符合物理和運動學規(guī)律的復雜場景的超逼真視頻。例如,當Sora學習人吃漢堡的視頻時,它記住的不僅是吃漢堡這一“具體畫面”,還有“咬了就會有痕跡”這個“物理規(guī)律”,讓AI生成的視頻更真實。
業(yè)內人士指出,世界模擬器是AI生成視頻的一種方式,它的成功會帶動視頻生成賽道的發(fā)展,加速視頻生成的創(chuàng)新和成熟。