谷歌DeepMind團(tuán)隊(duì)近日發(fā)布了一款名為Genie的基礎(chǔ)世界模型,其擁有110億參數(shù),能夠從一張圖片創(chuàng)造出可玩的虛擬世界。這一突破性的技術(shù)引起了網(wǎng)友的廣泛關(guān)注,標(biāo)志著AI已經(jīng)正式涉足視頻游戲領(lǐng)域。
不同于之前的模型,Google Genie通過學(xué)習(xí)20萬(wàn)小時(shí)的未標(biāo)注互聯(lián)網(wǎng)視頻,無(wú)需監(jiān)督訓(xùn)練即可生成豐富多樣的場(chǎng)景。更令人驚嘆的是,它無(wú)需任何動(dòng)作標(biāo)注,就能確定場(chǎng)景中的主角,并允許用戶與之互動(dòng)。這一特性使得Genie在創(chuàng)造虛擬世界方面具有巨大的潛力。
Google Genie通過三大核心組件實(shí)現(xiàn)其功能:潛動(dòng)作模型、視頻分詞器以及自回歸動(dòng)態(tài)模型。這些組件共同工作,生成一個(gè)學(xué)習(xí)潛動(dòng)作空間,不僅為用戶提供了交互式的體驗(yàn),還有助于訓(xùn)練智能體模仿看不見的視頻中的行為。
此外,Genie的創(chuàng)新之處還在于它能夠應(yīng)用于人類設(shè)計(jì)的草圖或現(xiàn)實(shí)世界的圖像上。通過最先進(jìn)的文本到圖像生成模型制作起始幀,Genie可以將其轉(zhuǎn)化為可交互的虛擬世界。這一功能為創(chuàng)建虛擬世界提供了新的途徑,極大地拓寬了Genie的應(yīng)用范圍。
Genie團(tuán)隊(duì)的負(fù)責(zé)人Tim Rockt?schel表示,Genie作為世界模型,是人類邁向通用人工智能(AGI)的重要一步。它的出現(xiàn)將重塑交互式生成環(huán)境的格局,為未來(lái)的通才智能體的發(fā)展奠定基礎(chǔ)。
總之,谷歌DeepMind發(fā)布的Genie模型為視頻游戲領(lǐng)域帶來(lái)了革命性的變化。其從一張圖片創(chuàng)造出可玩虛擬世界的能力令人矚目,預(yù)示著AI在游戲領(lǐng)域的廣泛應(yīng)用即將到來(lái)。
原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/633178.html