快手副總裁、可靈AI負責人張迪

值得一提的是,可靈2.0大師版全面升級視頻及圖像創(chuàng)作可控生成與編輯能力,上線全新的多模態(tài)視頻編輯功能,能靈活理解用戶意圖。支持在一段視頻的基礎之上,通過輸入圖片或文字,對生成的視頻內容實現元素的增加、刪減、替換,幫助創(chuàng)作者們實現更加靈活的二次編輯和處理。

可靈2.0大師版操作界面

可圖2.0:

圖像生成與編輯的「六邊形戰(zhàn)士」

快手負責人張迪披露,當前,圖生視頻約占到可靈AI視頻創(chuàng)作量的85%,圖片質量也對視頻的生成效果產生重要作用。

在圖像生成大模型領域,快手的可圖2.0處于行業(yè)領先水平,擁有多項核心優(yōu)勢,諸如強大的復雜語義理解能力、電影級的畫面質感、多條件的可控風格化生成等。在團隊內部的多項勝負率評測中,相較于Midjourney V7、FLUX1.1 [pro]以及Reve等行業(yè)領先的圖像模型,均保持明顯優(yōu)勢。

張迪介紹,可圖2.0文生圖能力迎來全面升級。包括大幅提升指令遵循能力、顯著增強電影美學表現力以及更多元的藝術風格。在風格化響應上,可圖2.0可支持60多種風格化的效果轉繪,模型出圖創(chuàng)意和想象力實現大幅躍升。

同時,可圖2.0也上線了實用的圖像可控編輯功能——局部重繪和擴圖,支持圖片的增加、修改和修復。在圖像的多模態(tài)可控生成中,可圖2.0還上線了全新的風格轉繪功能,只需要上傳一張圖片加上風格描述,就能一鍵切換圖片的藝術風格,同時精準保留原圖的語義內容。

3

AI生成進入“可信時代”

AIGC技術又一里程碑突破

可靈2.0的發(fā)布,標志著AIGC技術從“實驗室突破”邁向“產業(yè)可信化”:

技術普惠:通過MVL降低多模態(tài)創(chuàng)作門檻,非專業(yè)用戶可生成接近專業(yè)團隊的作品;

生態(tài)重構:與快手短視頻、直播業(yè)務深度耦合,推動“AI原生內容”成為平臺核心競爭力;

標準建立:提出“動態(tài)質量評估體系”,要求生成內容在物理規(guī)律、情感表達等維度達到影視級標準。

不過,行業(yè)專家指出,可靈AI仍需解決兩大矛盾:生成質量與成本的平衡(如高精度視頻的定價策略),以及創(chuàng)意同質化風險(用戶過度依賴模板生成內容)。

結語

一場“可靈速度”的長跑

從2024年6月首次發(fā)布到2025年4月迭代至2.0版本,快手僅用10個月便完成20余次技術升級,用戶規(guī)模增長25倍。這種“快迭代、強落地”的策略,既源于快手對短視頻內容痛點的深刻理解,也凸顯其在AI競賽中的緊迫感。

快手高級副總裁蓋坤表示:“可靈AI將持續(xù)大力推動技術創(chuàng)新,用人與AI交互的全新語言,幫助用戶實現復雜創(chuàng)意的精確表達,“我們的初心,是讓每個人都能用AI講出好的故事,我們也真切地希望這一天更快到來”。這場由快手發(fā)起的“智能創(chuàng)作革命”,或許正拉開AI時代內容生態(tài)重構的序幕。

分享到

lixiangjing

算力豹主編

相關推薦