谷歌發(fā)布110億參數(shù)Genie模型:從圖片到可玩虛擬世界

谷歌發(fā)布110億參數(shù)Genie模型:從圖片到可玩虛擬世界

谷歌DeepMind團隊近日發(fā)布了一款名為Genie的基礎世界模型,其擁有110億參數(shù),能夠從一張圖片創(chuàng)造出可玩的虛擬世界。這一突破性的技術引起了網(wǎng)友的廣泛關注,標志著AI已經(jīng)正式涉足視頻游戲領域。

不同于之前的模型,Google Genie通過學習20萬小時的未標注互聯(lián)網(wǎng)視頻,無需監(jiān)督訓練即可生成豐富多樣的場景。更令人驚嘆的是,它無需任何動作標注,就能確定場景中的主角,并允許用戶與之互動。這一特性使得Genie在創(chuàng)造虛擬世界方面具有巨大的潛力。

Google Genie通過三大核心組件實現(xiàn)其功能:潛動作模型、視頻分詞器以及自回歸動態(tài)模型。這些組件共同工作,生成一個學習潛動作空間,不僅為用戶提供了交互式的體驗,還有助于訓練智能體模仿看不見的視頻中的行為。

此外,Genie的創(chuàng)新之處還在于它能夠應用于人類設計的草圖或現(xiàn)實世界的圖像上。通過最先進的文本到圖像生成模型制作起始幀,Genie可以將其轉(zhuǎn)化為可交互的虛擬世界。這一功能為創(chuàng)建虛擬世界提供了新的途徑,極大地拓寬了Genie的應用范圍。

Genie團隊的負責人Tim Rockt?schel表示,Genie作為世界模型,是人類邁向通用人工智能(AGI)的重要一步。它的出現(xiàn)將重塑交互式生成環(huán)境的格局,為未來的通才智能體的發(fā)展奠定基礎。

總之,谷歌DeepMind發(fā)布的Genie模型為視頻游戲領域帶來了革命性的變化。其從一張圖片創(chuàng)造出可玩虛擬世界的能力令人矚目,預示著AI在游戲領域的廣泛應用即將到來。

原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/633178.html

若安丶的頭像若安丶管理團隊

相關推薦

發(fā)表回復

登錄后才能評論