從小模型到大模型,專用智能走向通用智能有哪些技術(shù)路線?

在2024年上海市產(chǎn)業(yè)技術(shù)創(chuàng)新大會上,上海人工智能實(shí)驗(yàn)室主任助理、領(lǐng)軍科學(xué)家喬宇指出,面向未來的通用人工智能有兩條發(fā)展路線。一是延續(xù)大模型路線,用更大的算力擴(kuò)大模型規(guī)模,拓寬能力邊界,向產(chǎn)業(yè)滲透;二是探索強(qiáng)化學(xué)習(xí)、知識計(jì)算、符號推理、類腦計(jì)算等新型路徑。這兩條技術(shù)路線并非孤立,要通過探索新的技術(shù)路線解決大模型現(xiàn)有路線中的固有問題。未來的創(chuàng)新將不再是某一個(gè)環(huán)節(jié)的簡單創(chuàng)新,而是要實(shí)現(xiàn)全鏈條優(yōu)化,彌補(bǔ)單環(huán)節(jié)劣勢。

·面向未來的通用人工智能,有兩條發(fā)展路線,一是延續(xù)大模型路線,二是探索強(qiáng)化學(xué)習(xí)、知識計(jì)算、符號推理、類腦計(jì)算及其他新型路徑。

·未來的創(chuàng)新將不再是某一個(gè)環(huán)節(jié)的簡單創(chuàng)新,大模型創(chuàng)新涉及芯片、互聯(lián)、框架、數(shù)據(jù)、模型、評測、部署等環(huán)節(jié),可多環(huán)節(jié)協(xié)同、體系化創(chuàng)新,實(shí)現(xiàn)全鏈條優(yōu)化,彌補(bǔ)單環(huán)節(jié)劣勢。

從小模型到大模型,專用智能走向通用智能有哪些技術(shù)路線?

上海人工智能實(shí)驗(yàn)室主任助理、領(lǐng)軍科學(xué)家喬宇。

“我們正處于專用智能時(shí)代到通用智能時(shí)代的關(guān)鍵階段?!?月22日,在2024年上海市產(chǎn)業(yè)技術(shù)創(chuàng)新大會上,上海人工智能實(shí)驗(yàn)室主任助理、領(lǐng)軍科學(xué)家喬宇表示,面向未來的通用人工智能,有兩條發(fā)展路線,一是延續(xù)大模型路線,用更大的算力擴(kuò)大模型規(guī)模,拓寬能力邊界,向產(chǎn)業(yè)滲透;二是探索強(qiáng)化學(xué)習(xí)、知識計(jì)算、符號推理、類腦計(jì)算及其他新型路徑。這兩條技術(shù)路選并非孤立和互相替代的,而是要通過探索新的技術(shù)路線解決大模型現(xiàn)有路線中的固有問題。

喬宇表示,2010年左右的深度學(xué)習(xí)方法驅(qū)動了一輪人工智能浪潮。最初十年,人工智能行業(yè)針對不同任務(wù)開發(fā)專用小模型?!澳菚r(shí)候大部分研發(fā)由應(yīng)用問題驅(qū)動,針對不同問題收集數(shù)據(jù)、訓(xùn)練模型,所以是分散式、多團(tuán)隊(duì)的研發(fā)。”

到2020年左右,Transformer+大數(shù)據(jù)+自監(jiān)督學(xué)習(xí)的大模型路線使得智能涌現(xiàn),一個(gè)模型可以應(yīng)對多種任務(wù)。在大模型時(shí)代,OpenAI找到了“大工程+大創(chuàng)新”的道路,工業(yè)化集中研發(fā)才得以產(chǎn)生ChatGPT、GPT-4。

面向未來的通用人工智能,他認(rèn)為有兩條發(fā)展路線。

一是延續(xù)大模型路線,用更大的算力擴(kuò)大模型規(guī)模,拓寬能力邊界,向產(chǎn)業(yè)滲透,模型也從語言大模型向多模態(tài)大模型、具身大模型的方向發(fā)展。多模態(tài)大模型是現(xiàn)在的競爭熱點(diǎn),未來的大模型要能和物理世界交流,完成更復(fù)雜的任務(wù),所以具身大模型是重要發(fā)展方向。

但單純擴(kuò)大規(guī)模,存在幻覺、效率、可信、安全等瓶頸,“現(xiàn)在讓一個(gè)大模型做一個(gè)奧數(shù)題和計(jì)算2+2這樣簡單的算術(shù)題,需要的運(yùn)算量、運(yùn)算次數(shù)是一樣的。所以,我們能否把大模型做得更安全、更高效,更好解決現(xiàn)在存在的一些瓶頸?”

這就涉及到了第二條新技術(shù)路線的探索,要探索強(qiáng)化學(xué)習(xí)、知識計(jì)算、符號推理、類腦計(jì)算及其他新型路徑。喬宇表示,基于知識、符號、推理的方法,可解釋性和安全性非常強(qiáng),把這些方法結(jié)合起來形成更強(qiáng)大的功能,是未來AI發(fā)展的重要趨勢之一。

這兩條技術(shù)路選并非孤立和互相替代的,喬宇認(rèn)為,要通過探索新的技術(shù)路線解決大模型現(xiàn)有路線中的固有問題。與此同時(shí),未來的創(chuàng)新將不再是某一個(gè)環(huán)節(jié)的簡單創(chuàng)新,大模型創(chuàng)新涉及芯片、互聯(lián)、框架、數(shù)據(jù)、模型、評測、部署等多個(gè)環(huán)節(jié),可多環(huán)節(jié)協(xié)同、體系化創(chuàng)新,實(shí)現(xiàn)全鏈條優(yōu)化,彌補(bǔ)單環(huán)節(jié)劣勢?!按蠊こ?創(chuàng)新鏈+產(chǎn)業(yè)鏈”,這種融合式的創(chuàng)新、與知名高校合作,是未來更重要的趨勢。

當(dāng)前,中國大模型發(fā)展面臨技術(shù)和生態(tài)的雙重挑戰(zhàn)。上海擁有金融、城市、制造等豐富的B端場景,他建議聯(lián)合領(lǐng)軍企業(yè)研發(fā)垂類模型,加快構(gòu)建開源生態(tài)反饋機(jī)制,打造大模型倫理安全評測體系,促進(jìn)健康發(fā)展和規(guī)范應(yīng)用。

本文轉(zhuǎn)載自:澎湃新聞,不代表科技訊之立場。原文鏈接:https://www.thepaper.cn/newsDetail_forward_26775491

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論