OpenAI Sora發(fā)布時間曝光 計劃加入音頻生成功能

OpenAI Sora發(fā)布時間曝光 計劃加入音頻生成功能

在人工智能領(lǐng)域持續(xù)創(chuàng)新的OpenAI公司,近日宣布了其最新研發(fā)成果——文生視頻工具Sora發(fā)布時間,公司表示將在數(shù)月內(nèi)面向公眾公開發(fā)布。這一消息由OpenAI首席技術(shù)官米拉·穆拉蒂在近日接受《華爾街日報》采訪時透露,引起了業(yè)界和公眾的廣泛關(guān)注。

據(jù)穆拉蒂介紹,OpenAI Sora不僅可以根據(jù)用戶的文本提示創(chuàng)建長達(dá)60秒的逼真視頻,更計劃加入音頻生成功能,進(jìn)一步提升視頻內(nèi)容的逼真程度和觀感體驗。此外,OpenAI還計劃允許用戶自行編輯Sora生成的內(nèi)容,以滿足不同用戶的需求和創(chuàng)作意愿。

穆拉蒂在采訪中并未透露用于訓(xùn)練OpenAI Sora的具體數(shù)據(jù)細(xì)節(jié),僅表示這些數(shù)據(jù)都是公開的或獲得許可的。她同時指出,OpenAI Sora在發(fā)布后可能無法生成包含公眾人物的影音內(nèi)容,且生成的視頻將帶有AI水印,以確保內(nèi)容的合法性和可追溯性。

此前,OpenAI的三名Sora核心團(tuán)隊成員在WVFRM播客頻道上透露,Sora目前仍處于反饋獲取階段,尚未成熟為一個完整的產(chǎn)品,短期內(nèi)不會向公眾開放。然而,隨著技術(shù)的不斷進(jìn)步和反饋的積累,Sora的發(fā)布日期已經(jīng)愈發(fā)臨近。

值得注意的是,在OpenAI即將發(fā)布Sora之際,另一個文生視頻平臺Pika已經(jīng)宣布推出新功能,允許用戶在生成的視頻中無縫生成和整合聲音。這一功能為用戶提供了更多創(chuàng)作空間,也為整個文生視頻領(lǐng)域的發(fā)展注入了新的活力。

隨著人工智能技術(shù)的不斷發(fā)展和應(yīng)用,文生視頻工具已經(jīng)成為一個備受矚目的領(lǐng)域。OpenAI的Sora作為其中的佼佼者,其發(fā)布將無疑為整個行業(yè)帶來新的突破和變革。未來,我們期待看到更多創(chuàng)新性的文生視頻工具問世,為人類帶來更加豐富和多樣的視覺體驗。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/636850.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論