從第二屆百度搜索創(chuàng)新大賽優(yōu)秀成果背后,探析AI大模型未來趨勢?

從去年底ChatGPT發(fā)布到現(xiàn)在,近一年的時間轉瞬即逝。而在這段時間里,不僅可以看到市場對大模型和生成式AI的認知改變,同時也可以看到AI大模型正推動世界加速擁抱AI帶來的變革。

近日,以「新搜索·新奇點」為主題的第二屆百度搜索創(chuàng)新大賽,歷經(jīng)3個月的角逐,完美落下帷幕。此次大賽圍繞人工智能、檢索技術,面向全國高校、企業(yè)、科研機構、項目團隊及個人廣發(fā)英雄帖,旨在挖掘和培育搜索 AI 人才,促進業(yè)內交流、產教融合,推動產品、算法和技術應用創(chuàng)新,賦能AI原生時代加速高質量推進。

大賽如火如荼,成果亦較為亮眼。數(shù)據(jù)顯示,戰(zhàn)況激烈的五大賽道,最終吸引了2800多人報名,5萬名同學直接參與相關課程學習,宣傳覆蓋100萬開發(fā)者群體。

在12月1日舉辦的第二屆百度搜索創(chuàng)新大賽頒獎典禮上,NVIDIA 全球副總裁何濤表示,“在這一年里,各行各業(yè)都經(jīng)歷了從通用計算到加速計算和生成式AI的平臺轉型。初創(chuàng)企業(yè)、互聯(lián)網(wǎng)公司和云服務商,積極投資大模型、AI云和應用落地。希望在場的各位參賽者,能夠順應技術發(fā)展趨勢,把握機會,提升自我競爭力,加速你們的職業(yè)成功?!?strong>

“因時而變,因勢而變”

并非所有企業(yè)適合AI大模型

聚力創(chuàng)新,力量正在崛起,第二屆百度搜索創(chuàng)新大賽成果印證一切。

較為直觀的體現(xiàn)是,第2屆百度搜索創(chuàng)新大賽設立了五大賽題,題目涉及搜索核心業(yè)務場景,如語義檢索、多模態(tài)、軟硬結合優(yōu)化等豐富的技術方向,并且開設了產品賽道,廣發(fā)英雄帖,號召參賽者“洞察用戶在搜索場景的需求,并通過構建AI應用解決”。從數(shù)據(jù)來看,五大賽道報名 2800人,比去年多1000多人,賽題各有側重,難點不一,成果亦較為亮眼。

以大賽為平臺,引領大模型時代“新搜索”的未來,百度搜索創(chuàng)新大賽攜手新一代“AI未來新星”,沖向無限可能。但從賽場過渡到行業(yè)當前境況來看,不禁需要思考:在創(chuàng)新力量的加持下,是不是所有企業(yè)都可以如百度一樣適合自建大模型?

這需從大模型發(fā)展現(xiàn)狀說起。從今年3月開始,國內的AI大模型如雨后春筍般涌現(xiàn)?!吨袊斯ぶ悄艽竽P偷貓D研究報告》顯示,截至2023年5月底,國內10億級參數(shù)規(guī)模以上基礎大模型至少已發(fā)布79個。

毫不夸張地說,“百模大戰(zhàn)”已開啟。IDC預測,2026年中國AI大模型市場規(guī)模將達到211億美元,人工智能將進入大規(guī)模落地應用關鍵期。

“因時而變,因勢而變”。比較具體的就是,AI大模型在創(chuàng)作、效率工具、教育、營銷、金融等領域已經(jīng)衍生了大量的創(chuàng)新業(yè)務,而微軟發(fā)布的Fabric平臺開始用大模型能力打造新一代的AI數(shù)據(jù)分析平臺,更給這個領域帶來了無限的想象力。那么在構建AI大模型的過程中,核心要做的是什么?即要清晰認識本企業(yè)/行業(yè)大模型應用的需求場景與價值,明確公司的目標和愿景。同時,選擇適用于公司需求的最佳解決方案制定計劃實施也較為重要。據(jù)NVIDIA方面表示,“大模型應用的建設路徑可以有很多選擇,除了上述自建專屬大模型的方案,直接使用API或插件接入、基于平臺公司的提供的基礎大模型行業(yè)方案,公有云或混合方案來構建,現(xiàn)在市場上都有靈活的選擇。比如,直接使用API或插件接入門檻最低,對注重快速應用上線,數(shù)據(jù)保密保護要求不高的企業(yè)可以選擇效果不錯;服務穩(wěn)定可靠的平臺公司的API或者提供有限個性化微調的公有云平臺服務實現(xiàn)快速應用搭建;對希望能夠自己控制基礎設施以保護數(shù)據(jù)資產的企業(yè),選擇其他基礎大模型平臺提供的安全部署方式來做微調和部分定制,通過自有標注數(shù)據(jù)和配置參數(shù)來訓練自己的大模型也是不錯的選擇?!?/p>

但不論采用哪種方式,重要的是要不斷測試和優(yōu)化,以最佳方式滿足業(yè)務需求。

競爭與革新,

什么樣的企業(yè)適合AI大模型

能夠看到,構建AI大模型,并非一蹴而就,其建立的基礎在于企業(yè)自身技術實力、投資預算以及需求定位等各方面的考量。

那么在這一點上,在人工智能領域深耕多年的頭部科技企業(yè)百度顯然較具代表性。以文心大模型4.0為例,在重構AI原生應用的底座文心大模型方面,今年10月份,百度發(fā)布文心大模型4.0,用戶可以通過文心一言體驗文心4.0版本,企業(yè)可以通過百度智能云千帆大模型平臺調用文心4.0的API,并且百度智能云千帆大模型平臺服務企業(yè)已超過2萬家,覆蓋近500個場景。目前,文心一言用戶數(shù)達7000萬,覆蓋場景4300個。

事實上,過去幾年在搜索領域,百度搜索已構建了多項關鍵技術。首當其沖的就是超大規(guī)模深度語義匹配模型。該模型當前每天在線可以提供萬億次服務,是業(yè)界最大的在線推理系統(tǒng),讓用戶可以搜到更為精準的信息。

刪格化索引亦是不容錯過的關鍵。該項技術通過索引萬億網(wǎng)頁、視頻、圖片和信息,可以確保任何用戶想要的信息都能在幾百毫秒中返回。

同時,百度搜索還打造了一套跨模態(tài)的問答系統(tǒng),可以將視頻、圖片中的內容直接回答用戶的問題。此外,今年百度還創(chuàng)新打造了一套全新的搜索系統(tǒng),將大語言模型和搜索系統(tǒng)融合在一起,大幅提升了線上效果。比如,占搜索相當大比例的各種長尾問答需求,極致滿足的比例提升到70%,也激發(fā)用戶每天新增表達5000w問答需求。

其中,值得關注的是,為使得服務更具多元化,真正做到搜索的極致滿足體驗,百度搜索還上線了包括多答案決策系統(tǒng)、文本、圖片創(chuàng)作產品等,進一步提升用戶的新場景滿足能力,探索新的交互形式,通過自然語言多輪、跨模態(tài)交互、為用戶打造AI伙伴。

創(chuàng)新從不止步,服務更是精細化向前。在百度搜索的應用中,大模型對深度語義匹配、跨模態(tài)的內容理解和問答,以及百度全新推出的搜索系統(tǒng)長尾問答需求等很多領域效果提升明顯。我們也看到,全新百度搜索系統(tǒng)不斷推出大模型應用融合功能,比如多答案決策系統(tǒng)、文本、圖片創(chuàng)作產品和對自然語言多輪、跨模態(tài)交互等新的交互方式的探索,不斷融入大模型能力。

不過,需要關注的是,這些應用上線服務對于百度搜索這樣每天萬億次在線服務級別的物理系統(tǒng),在性能和吞吐上將面臨極大的壓力,如何解決?百度大模型與搜索團隊的研究和工程團隊不斷的探索在模型規(guī)模壓縮、量化和引擎優(yōu)化等各方面方法的結合來優(yōu)化系統(tǒng)性能,NVIDIA工程優(yōu)化專家也在系統(tǒng)性的性能分析,方案分享甚至算子融合優(yōu)化等各方面提供持續(xù)支持,通過搜索效率提升和資源節(jié)省實現(xiàn)大模型部署能力的支撐。NVIDIA工程師也在與文心大模型工程團隊緊密合作,持續(xù)為訓練推理的優(yōu)化提供支持。

創(chuàng)新的領域,從來不乏競爭者。所以,更需不斷革新。NVIDIA一直致力于從硬件到軟件全棧的加速計算能力的持續(xù)改進,以滿足不斷增長的模型和數(shù)據(jù)規(guī)模帶來的算力需求和壓力。

何濤在大會上表示,“今年,NVIDIA也和百度大搜在Megatron LM/Nemo FW、基于SD的內容生成、ANN向量召回、性能優(yōu)化等方面,開展了深入合作。未來,我們期望雙方團隊能夠進一步加深合作,助力百度大搜在生成式AI的浪潮中取得更加輝煌的成績?!?/p>

據(jù)了解,百度作為中國人工智能技術綜合實力領先的互聯(lián)網(wǎng)公司,在生成式AI和大模型的新興機遇背景下,不斷強化技術、改進產品, 重構了消費級、企業(yè)級產品及自身運營;在為用戶帶來AI原生體驗的同時不斷提升效率,Q3營收同比大漲23%,實現(xiàn)了爆發(fā)式增長。

NVIDIA 開發(fā)與技術部門亞太區(qū)總經(jīng)理李曦鵬在頒獎典禮上表示,“從最早書籍檢索、數(shù)據(jù)檢索,到了數(shù)字化過后內容的檢索,到現(xiàn)在如火如荼基于LLM生成式檢索,都在說明一個好的領域可以不斷地引領創(chuàng)新、不斷地產生創(chuàng)新、同時不斷地吸收創(chuàng)新。搜索業(yè)務本身是NLP、CV、語音這些最前沿Deep Learning的合集?;诖?,大模型有創(chuàng)新,第一個落地場景就是搜索。對于大模型在搜索引擎里大放異彩,是非常值得期待的?!?strong>

未來與趨勢

技術變革時代,創(chuàng)新力量不容忽視

大模型的不斷發(fā)展和與其他技術產品結合的過程將是持續(xù)探索和嘗試的過程。但無論如何,大模型的出現(xiàn)都是一個革命性的突破,而隨著技術的不斷推進,未來趨勢也將更為明晰。

技術向前,創(chuàng)新從未停駐。今年10月,NVIDIA還公開發(fā)布了TensorRT-LLM,一個用于加速大語言模型(LLM)推理的庫,是一款提升 AI 推理性能的開源軟件。為支持 AI 開發(fā)者,該公司發(fā)布的TensorRT-LLMv0.6.0?更新將帶來至高達5倍的推理性能提升,并支持更多熱門的LLM,包括全新Mistral7B和Nemotron-38B。這些LLM版本將可在所有采用8GB及以上顯存的GeForce RTX 30系列和40系列GPU上運行,從而使便攜的WindowsPC設備也能獲得快速、準確的本地運行LLM功能。

定制的生成式 AI 需要時間和精力來維護項目。特別是跨多個環(huán)境和平臺進行協(xié)作和部署時,該過程可能會異常復雜和耗時。AI Workbench 是一個統(tǒng)一、易用的工具包,允許開發(fā)者在 PC 或工作站上快速創(chuàng)建、測試和定制預訓練生成式 AI 模型和 LLM。它為開發(fā)者提供一個單一平臺,用于組織他們的 AI 項目,并根據(jù)特定用戶需求來調整模型。這使開發(fā)者能夠進行無縫協(xié)作和部署,快速創(chuàng)建具有成本效益、可擴展的生成式 AI 模型。加入搶先體驗名單,成為首批用戶以率先了解不斷更新的功能,并接收更新信息。

一切革新的背后,都離不開創(chuàng)新的力量。這股創(chuàng)新的力量就是人才。廣發(fā)英雄帖,構建一個大型的AI舞臺,百度搜索創(chuàng)新大賽所要做的就是廣泛招攬優(yōu)秀人才,為行業(yè)蓄能。而在生態(tài)建設和人才培養(yǎng)層面,NVIDIA與百度近年來也在不斷加速推進。

“我們積極支持百度的Paddle平臺框架在NVIDIA軟硬件平臺的加速優(yōu)化,并通過技術大賽,技術社區(qū)共同推廣的方式共同推動AI創(chuàng)新生態(tài)的發(fā)展,發(fā)掘和培育創(chuàng)新AI技術人才?!?NVIDIA方面表示,“我們期待通過雙方的合作,將百度在搜索領域包括AI大模型應用及各種搜索技術創(chuàng)新以最優(yōu)的性能在NVIDIA加速計算平臺上提供給客戶,助力百度搜索不斷推出創(chuàng)新服務,結合在AI大模型為客戶提供多語言、多模態(tài)和包含更多領域知識的服務,為用戶提供更豐富、個性化和智能化的搜索體驗?!?/p>

此外,NVIDIA給開發(fā)者提供了許多學習交流的資源,NVIDIA 的開發(fā)者社區(qū),目前在全球已經(jīng)有450萬開發(fā)者,CUDA加速庫下載量也超過4800萬次。面對生成式AI浪潮,NVIDIA非常歡迎廣大同學們和參賽選手加入其開發(fā)者社區(qū),以提升自我競爭力,加速職業(yè)成功。

原創(chuàng)文章,作者:陳晨,如若轉載,請注明出處:http://2079x.cn/article/601817.html

陳晨陳晨管理團隊

相關推薦

發(fā)表回復

登錄后才能評論