6月19日,AI初創(chuàng)公司Midjourney繼推出圖片生成服務(wù)之后,發(fā)表了首個視頻模型V1,利用圖像生成視頻,費用是生成圖片價格的8倍。

Midjourney表示,公司目標是構(gòu)建一個可實時模擬開放世界的模型。想象一個可實時生成視頻的AI系統(tǒng),支持用戶命令它在3D空間移動,環(huán)境及角色也會跟著移動彼此形成互動。為了達到這個目標,Midjourney要建立各種模塊,比如圖片模型,讓圖片動作的視頻模型,以及能在空間中移動的3D模型,還有能快速完成所有操作的實時模型。

明年起,Midjourney將這些元件整合成一個統(tǒng)一的系統(tǒng),一開始可能比較貴,但很快就會變得經(jīng)濟實惠,讓每個人都能使用。

V1是Midjourney所推出的第一個影片模型,它的工作流程基本上是圖片轉(zhuǎn)視頻(Image-to-Video),一開始還是制作或上傳圖像,成為影像的第一幀圖,再按下“Animate”運行。使用者可以選擇自動或是手動,前者是由系統(tǒng)決定動作,后者允許使用者描述物體的移動方式與場景的變化。

使用者還可以選擇低速(low motion)或高速(high motion)運動,前者代表主體的行動是緩慢的,后者則會讓所有物件都動起來,不過這樣容易出現(xiàn)一些錯誤。

根據(jù)Midjourney的視頻模型說明文件,V1基本會生成一個5秒、分辨率為480p的影片,之后可以選擇延長影片,每次延長時間為4秒,最多可延長4次,代表可建立最長21秒的影片。

現(xiàn)階段Midjourney并未提供免費額度,目前提供4種訂閱方案,都可生成圖或視頻,每個方案的額度計算方式為快速GPU時間(Fast GPU Time),最便宜的是每月10美元的基本方案(Basic Plan),F(xiàn)ast GPU Time額度為每月200分鐘。除了基本方案之外的3種相對高階方案,都有提供放松GPU時間(Relax GPU Time),它的生成速度較慢,可能需要排隊,但不消耗額度,還可以無限使用。

Midjourney表示,用戶生成一個影片的成本約是圖像的8倍,但這是市場上其他視頻生成服務(wù)的1/25。

不過圖片生成也為Midjourney帶來一些不可避免的麻煩,目前迪士尼和環(huán)球影業(yè)都在指控Midjourney利用其動畫角色訓(xùn)練模型,允許使用者生成基于相同角色的圖像,還拿這些生成作品來營利,嚴重且故意侵害其著作權(quán)??磥硪院笊傻膱D片版權(quán)問題也要注意了。

分享到

崔歡歡

相關(guān)推薦