近日,人工智能在全球掀起革命浪潮,從生成文本到文本生成圖像。3月21日, AI 初創(chuàng)公司 Runway宣布了一種新的 AI 視頻生成模型,這個(gè)模型可以實(shí)現(xiàn)從文本到視頻的轉(zhuǎn)化。
據(jù)發(fā)布的資料顯示,Runway 提供了一個(gè)基于網(wǎng)絡(luò)的視頻編輯器,專門用于背景移除和姿勢(shì)檢測(cè)等 AI 工具。該公司幫助開發(fā)了開源文本到圖像模型Stable Diffusion ,并于 2 月宣布了其首個(gè) AI 視頻編輯模型 Gen-1 。
Gen-1 專注于轉(zhuǎn)換現(xiàn)有的視頻片段,讓用戶輸入粗略的 3D 動(dòng)畫或搖晃的智能手機(jī)剪輯并應(yīng)用 AI 生成的疊加層。例如,在下面的剪輯中,硬紙板包裝的鏡頭與工業(yè)工廠的圖像配對(duì),制作出可用于故事板或推介更精美的功能的剪輯。
相比之下,Gen-2 似乎更專注于從頭開始生成視頻,盡管有很多注意事項(xiàng)。首先,Runway 分享的演示片段短小、不穩(wěn)定,而且肯定不逼真,其次,訪問受限。彭博社報(bào)道稱,用戶必須通過 Runway 的 Discord 注冊(cè)才能加入 Gen-2 的候補(bǔ)名單,該公司發(fā)言人 Kelsey Rondenet 告訴 The Verge,Runway將“在未來幾周內(nèi)提供廣泛的訪問權(quán)限”。
換句話說,我們現(xiàn)在要判斷 Gen-2的只是一個(gè)演示卷軸和一些剪輯(其中大部分已經(jīng)作為 Gen-1 的一部分進(jìn)行廣告宣傳)。
去年,ChatGPT一經(jīng)發(fā)布迅速爆紅網(wǎng)絡(luò),點(diǎn)燃了全球?qū)θ斯ぶ悄芗夹g(shù)的新一波浪潮。上周,微軟宣布正在將ChatGPT的同源技術(shù)嵌入其旗下的辦公軟件中,以輔助用戶的工作。媒體稱,它已經(jīng)可以充當(dāng)程序員的得力助手,未來將致力于為每一個(gè)職業(yè)都解鎖類似的功能,釋放更多的生產(chǎn)力。
這個(gè)全新的 AI 視頻生成模型如果表現(xiàn)優(yōu)異,有可能將引起新一輪的熱潮。此前,埃隆·馬斯克將人工智能比作核技術(shù),“它有巨大的前景也有巨大的能力,但隨之而來的危險(xiǎn)也是巨大的。”
原創(chuàng)文章,作者:蘋果派,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/570331.html