#谷歌稱首次實現(xiàn)量子霸權(quán)#為了解決這個問題,谷歌的AI團隊開發(fā)了一種開源解決方案Autoflip,可以對適合目標(biāo)設(shè)備或尺寸(風(fēng)景,正方形,人像等)的視頻進行重新格式化。

自動翻轉(zhuǎn)的工作分為三個階段:鏡頭(場景)檢測,視頻內(nèi)容分析和重新構(gòu)圖。第一部分是場景檢測,其中 機器學(xué)習(xí)模型需要在剪切或從一個場景跳轉(zhuǎn)到另一個場景之前檢測點。 因此,它將一幀與之前的一幀進行比較,以檢測顏色和元素的變化。

圖片來自網(wǎng)絡(luò)

一旦模型確定了鏡頭,便會繼續(xù)進行視頻內(nèi)容分析,以確定場景中的重要對象。它使用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)不僅可以確定人或動物,還可以確定運動中的運動和移動球以及廣告中的標(biāo)記。

在最后階段,AI模型確定是 針對單個空間中的場景使用固定模式,還是關(guān)注對象不斷移動的跟蹤模式。基于此,以及 需要顯示視頻的目標(biāo)尺寸,“自動 翻轉(zhuǎn)”將裁剪幀,同時減少抖動并保留感興趣的內(nèi)容。

谷歌研究人員表示,可以使用Autoflip輕松地將視頻轉(zhuǎn)換為多種格式和屏幕。對于下一階段,團隊希望改善采訪和動畫電影中的對象跟蹤。它希望使用文本檢測和圖像修復(fù)技術(shù)將前景對象和背景對象更好地放置在一幀中。

分享到

崔歡歡

相關(guān)推薦