騰訊蘇奎峰:數(shù)字孿生與生成式AI融合加速認知孿生進化

近年來,在數(shù)實融合的大背景下,數(shù)字孿生以其全息映射、仿真推演、分析預測、實時交互等能力,正成為企業(yè)全面深化數(shù)字化轉(zhuǎn)型的核心支撐技術(shù)之一。生成式人工智能(AIGC, AI-generated content)則為人類社會打開了創(chuàng)造世界的大門,有望在各個領(lǐng)域帶來生產(chǎn)力的革命性飛躍。數(shù)字孿生與AIGC相互加持,建立一個彼此驅(qū)動的優(yōu)化迭代“飛輪”體系,必將為世界的發(fā)展帶來巨大加速度。

在近日舉行的2023界面REAL科技大會上,騰訊數(shù)字孿生產(chǎn)品部/自動駕駛業(yè)務總經(jīng)理蘇奎峰受邀出席,發(fā)表了題為《數(shù)字孿生與生成式AI閉環(huán)迭代進化》的主題演講。

數(shù)字孿生:“可視、可算和可用”的價值

數(shù)據(jù)顯示,2022-2029年數(shù)字孿生中國市場規(guī)模年均增速達42%,已成為工業(yè)、航空航天、交通、能源等行業(yè)數(shù)字化轉(zhuǎn)型的核心支撐技術(shù)。政策層面,數(shù)字孿生已被納入國家關(guān)鍵技術(shù)戰(zhàn)略,各部委、各地方、各行業(yè)政策設計加速完善,形成“技術(shù)+應用”的雙輪驅(qū)動體系。

640.png

數(shù)字孿生到底具備怎樣的價值,何以得到如此重視?

實際上,當前市面上對數(shù)字孿生應用價值的理解存在一些誤區(qū)。蘇奎峰認為,首先,數(shù)字孿生并不是一個單一的二三維可視化系統(tǒng),而一定具備更深層次的洞察能力,具有交互和體驗價值;其次,數(shù)字孿生和傳統(tǒng)的模擬仿真也有不同,當然“仿真”是孿生的靈魂,是數(shù)字孿生的價值高地,“無仿真不孿生”,但只有仿真也不能稱之為孿生。用一句話來概括,實時數(shù)據(jù)驅(qū)動的仿真才是數(shù)字孿生;此外,數(shù)字孿生要和VR、AR、MR等3D數(shù)字媒介區(qū)分開來,XR為數(shù)字孿生提供了非常好的交互體驗,同時數(shù)字孿生又是XR的內(nèi)容基礎。數(shù)字孿生之所以獲得方方面面的關(guān)注,在于它所具備的價值更巨大、前景更廣闊。

對于數(shù)字孿生的價值,蘇奎峰將其總結(jié)為三點:對真實世界的“可視、可算和可用”。

● “可視”在于對現(xiàn)實世界的看見、看懂、洞察;

● “可算”體現(xiàn)在將物理世界模型化和參數(shù)化,以實時數(shù)據(jù)驅(qū)動和推演,以獲得更強和更大規(guī)模的計算能力;

● “可用”是指數(shù)字孿生可以提供沉浸式、游戲化的交互體驗,大規(guī)模復雜系統(tǒng)的在線協(xié)同,以及數(shù)據(jù)驅(qū)動下的閉環(huán)優(yōu)化和控制。

640 (1).png

全真互聯(lián)是下一代互聯(lián)網(wǎng)的重要趨勢,也是以數(shù)實融合助力產(chǎn)業(yè)發(fā)展的重要戰(zhàn)略和路徑。而數(shù)字孿生作為全真互聯(lián)的核心技術(shù)之一,已成為騰訊全真互聯(lián)網(wǎng)戰(zhàn)略下的關(guān)鍵一環(huán)。

640 (2).png

圍繞數(shù)字孿生的三大價值要素,騰訊基于游戲科技、云計算/云渲染、人工智能、模擬仿真、高精地圖、全息感知以及音視頻傳輸?shù)群诵募夹g(shù),打造出空間構(gòu)造、物聯(lián)感知、時空計算、逼真渲染、仿真推演5大核心能力,形成一站式數(shù)字孿生平臺,并聯(lián)合眾多生態(tài)伙伴打造出面向城市、交通、建筑、制造、能源、文旅等多個行業(yè)場景下的數(shù)字化解決方案,構(gòu)筑起開放共創(chuàng)的數(shù)字孿生行業(yè)生態(tài)。

數(shù)字孿生+生成式AI:雙螺旋式的閉環(huán)迭代進化

去年底,隨著ChatGPT一聲炮響,AIGC因其具備分析和創(chuàng)造文本、圖像、視頻以及三維數(shù)據(jù)而備受廣泛關(guān)注,人工智能也由判別式向生成式快速切換,為各行各業(yè)應用創(chuàng)造出巨大潛力。AIGC作為一種能夠創(chuàng)造新內(nèi)容的AI技術(shù),在數(shù)字孿生領(lǐng)域中,AIGC也能夠提供更多的助力作用。

蘇奎峰總結(jié)指出,AI技術(shù)尤其是AIGC技術(shù)提升數(shù)字孿生能力主要體現(xiàn)在5個方面:工作機理模型和三維模型構(gòu)建、實時數(shù)據(jù)驅(qū)動的模型更新、生成式模型增強、數(shù)據(jù)分析、仿真預測以及智能決策。

640 (3).png

同時采用AIGC技術(shù)還可以創(chuàng)造出更多的合成數(shù)據(jù),尤其是一些敏感或高安全領(lǐng)域的數(shù)據(jù)和長尾數(shù)據(jù),從而填補真實數(shù)據(jù)中的缺口,提升孿生模型精度;AIGC可以快速產(chǎn)生多種設計和運行方案,讓工程師或決策者從中選擇最優(yōu)解,減少傳統(tǒng)方法下的嘗試和錯誤。借助ChatGPT這種大語言模型,可以實現(xiàn)更友好的人機協(xié)同。

640 (4).png

反過來,數(shù)字孿生同樣也能為AIGC“豐滿血肉”。

● 首先,數(shù)字孿生模型可以提供大量高質(zhì)量、結(jié)構(gòu)化的數(shù)據(jù),這對于訓練AIGC模型,特別是需要大量數(shù)據(jù)的模型如GANs,非常有價值;

● 其次,數(shù)字孿生為AIGC提供了一個無風險、高逼真的驗證環(huán)境,可以嘗試和測試新的策略或方法,驗證更多的極端情況,融合實時孿生數(shù)據(jù),還能夠確保實際應用的準確性和可靠性;

● 第三,數(shù)字孿生模型可以為AIGC提供實時或近實時的反饋,使其能夠不斷優(yōu)化和改進生成的內(nèi)容或模型;

● 第四,數(shù)字孿生提供一個可交互的三維可視化平臺,有助于人在環(huán)參與其中,幫助解釋和理解AIGC的輸出,增加透明度和可信性;

● 最后,數(shù)字孿生可以為AIGC提供特定的場景或應用,使AI能夠更有針對性地生成內(nèi)容或做出決策。

生成式AI+數(shù)字孿生=認知孿生,加速自動駕駛研發(fā)落地

AI正在給世界帶來巨大改變,AI技術(shù)本身也在不斷的演進中。隨著AIGC的逐步成熟,人工智能除了具備學習和重復能力外,還能夠創(chuàng)造,讓我們在從描述世界向編輯世界和創(chuàng)造世界演進。

640 (5).png

過去,AI和數(shù)字孿生是兩個相對獨立的體系。而在當下,數(shù)字孿生和AI的融合越來越多。數(shù)字孿生絕大多數(shù)都是多孿生體的集成,比如,自動駕駛測試中的基于多智能體的交通流模擬,在孿生構(gòu)建過程中更希望每個孿生體具備可信的人類駕駛行為或真實實體的行為模擬,而且需要具備交互能力。實驗表明,利用大語言模型驅(qū)動生成式智能體的行為,可以支持智能體具備更長時間的一致性,管理動態(tài)進化的記憶能力和遞歸生成能力。AIGC與數(shù)字孿生的結(jié)合,能夠產(chǎn)生更復雜的,具備記憶、檢索、反思和推理等能力的虛擬或虛實融合環(huán)境,這就是我們所稱的認知孿生。

自動駕駛是典型的四維空間計算問題,其核心是在四維空間下的感知、建圖、定位和決策規(guī)劃的實現(xiàn)。在BEV+OCC框架或正在被驗證的端到端自動駕駛計算框架下,無論是算法訓練還是測試驗證,數(shù)字孿生與AIGC相結(jié)合的認知孿生體系,對自動駕駛落地都是不可或缺。

● 首先,認知孿生依然強調(diào)虛實融合,虛實互動以及虛實一致等問題,不是完全脫離現(xiàn)實而自動生成,而是通過傳感器采集真實數(shù)據(jù),通過AI和數(shù)字孿生技術(shù)建模,然后再以此為基礎進行生成編輯;

● 其次,動態(tài)場景具備四維特征,是多智能體,具有記憶、檢索、追溯和推理能力,充分利用這些特性,可以提升復雜場景構(gòu)建精度,降低構(gòu)建成本;

● 最后,為自動駕駛構(gòu)建的認知孿生體,以AIGC支撐的多智能體,具有博弈和對抗能力,能夠更有效地模擬現(xiàn)實駕駛的博弈策略,提升系統(tǒng)決策規(guī)劃能力。同時,這種體系在解決自動駕駛數(shù)據(jù)生產(chǎn)效率、長尾或極端case以及樣本均衡等問題一定會有顯著的收益。

640 (6).png

認知孿生(Cognitive Digital Twins,CDT)是數(shù)字孿生的一種擴展形式,除了基本DT功能外,還具備認知功能,如記憶、檢索、反思和推理。其核心思想是利用先進的數(shù)據(jù)分析、機器學習和人工智能技術(shù),使模型具備自我學習、推理和決策能力。一個完整的認知孿生,具備感知、記憶、學習、注意力、推理以及最終問題求解能力,并依賴于云端存儲、數(shù)據(jù)分析、知識圖譜、仿真優(yōu)化等技術(shù)驅(qū)動實現(xiàn)這些能力。

640 (7).png

可以看出,二者的融合正在不斷升級人類和世界的交互模式:從描述世界到編輯世界,再到創(chuàng)造世界,獲得更強的自主認知、思考、決策能力,最終實現(xiàn)“認知孿生”。展望未來,蘇奎峰表示:數(shù)字孿生與AIGC的融合能構(gòu)成一個閉環(huán)迭代的體系。一旦這樣的閉環(huán)體系構(gòu)建起來,將具有生命體的特征,為各行各業(yè)的數(shù)字化、智能化,提供可持續(xù)迭代的智慧助力。

原創(chuàng)文章,作者:陳晨,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/591550.html

陳晨陳晨管理團隊

相關(guān)推薦

發(fā)表回復

登錄后才能評論