新編輯:桃子【新智元導讀】AI視頻生成,Midjourney終于落下大錘了!今天,V1視頻生成模型正式上線,每一幀效果超逼真,網友上手實測驚掉下巴。終于等
來了!Midjourney首個AI視頻模型,猝不及防震撼登場。
一大早,官方正式上線了
V1視頻模型,僅用三個詞總結——有趣、
易用、驚艷。
每個月僅需10美金,最長輸出20秒,即可體驗Midjourney放出了2分多
V1
視頻的暢享版,毫不夸張,每一幀都是視覺盛宴。左右滑動查看它的視覺效果,分分鐘秒掉RunwayGen-4,足以媲美谷歌Veo3、OpenAISora。
V1強大之處在于,它還可以生成圖像,然后點擊「動畫」按鈕,瞬間便可讓畫面動起來。
真的是,一鍵直出大片。最關鍵的是,每秒視頻的成本,約等于一張圖像!上手后的網友紛紛驚呆,好評如潮,「完全超出了我的預期」。左右滑動查看V1生成的視頻,究竟是一種怎樣的驚艷?AI生視頻,還得看Midjourney直接上圖。
列車飛快駛過,一頭卷發女孩的3D卡通人物特色非常鮮明。再來看真人面部刻畫,效果非常逼真,可以稱得上是電影級輸出了。左右滑動查看萌寵懟鏡頭的視角,丑萌丑萌的。
雕塑+賽博朋克元素相撞,給人一種視覺沖擊感。還有打破想象的各種藝術風格效果。左右滑動查看日漫風視頻,再加上配樂,演唱會現場的氛圍就來了。
恐龍和人類大戰,畫面質感堪比好萊塢大片。再來看V1的流體測試,可能還未通過「物理測試」,倒入紅酒感覺是對的,但總到不滿就有些詭異了。
海平面上一個大火球,被海浪推起,但畫面存在定格問題,不是特別流暢。
沃頓商學院CS教授EthanMollick點評,V1與圖像生成一脈相承,這樣的優勢在于:它能創造出其他視頻工具難以實現的獨特風格,擺脫傳統視頻拼貼的套路感。左右滑動查看
更多V1生成的視頻demo如下。左右滑動查看V1雙線集成,成本打到
最低過去幾年,Midjourney當紅
出道,一夜成為AI生成圖像領域炸雞子。然而,今時不同往日,AI視頻模型備受熱捧。
視頻模型V1正式上線(目前是一個過渡版本),標志著Midjourney終于邁出了關鍵的一步。
這款視頻工作流,被稱為「圖像到視頻」。這意味著,你可以像往常一樣生成圖像,然后點擊「動畫」按鈕讓它們動起來。
V1提供了兩種模式:「自動動畫」和「手動動畫」。前者系統會生成運動提示,一鍵讓畫面動起來,簡單又有趣;后者是通過文字描述,精準控制物體如何移動、場景如何展開。此外,它還有「高運動」和「低運動」兩種設置:低運動:更適合環境場景,攝像頭基本保持靜止,主體以緩慢或刻意的方式移動。
缺點是,有時
可能會得到完全不動的效果!高運動:最適合希望一切都動的場景,包括主體和攝像頭。
缺點是,所有這些運動有時會導致奇怪的錯誤。
喜歡某個視頻?也沒問題。
V1可以將其延長「擴展」,每次大約增加4秒,最多四次,能打造出更完整的動態故事。
更酷的是,還可以上傳外部圖像,作為「起始幀」,通過運動提示讓其動起來。
一位網友為一個視頻片段,擴展3次,整體氛圍、色彩、一致性表現非常出彩。目前,V1僅限網頁版。至于收費,每個視頻價格大約是圖像的8倍,一次可生成四個5秒視頻。
簡言之,每秒視頻大約是「一張圖像的成本」。
令人驚訝,比市場之前推出的便宜25倍以上。
模擬宇宙,矩陣世界?在不過上千字的介紹中,Midjourney還分享了一個技術愿景——實時開放世界模擬,是一個必然的方向。
想象一下,一個AI系統不僅能實時生成動態畫面,人類能命令其在3D世界中移動,環境和角色也會隨之移動,還可以與一切進行互動。
這不就是,矩陣中的世界么?Midjourney希望的是,能夠將虛擬世界帶入現實。
正因此,他們決定先
放出V1,進而推動下一步計劃。
如前所述,為了實現這個最終目標,他們需要一步步構建基礎模塊。·視覺效果:首個圖像模型,為畫面奠定了基礎?!討B影像:首個視頻模型V1,讓圖像「活」起來·空間移動:3D模型,能在空間中自由探索·實時
響應:實時模型,確保這一切快到起飛未來一年,Midjourney將會逐一完善這些模塊,最終整合成一個
統一的系統。可以期待的是,這樣的世界離我們不會太遙遠。
參考資料:https://x.com/midjourney/status/1935377196195135717