百度文心大模型4.0即將發(fā)布，萬卡訓(xùn)練史上最大參數(shù)模型

AI ? 2023年10月11日 19:03:34 ? AI

近日，有媒體報(bào)道稱，百度正加緊訓(xùn)練文心大模型4.0，這將是文心大模型3.5版本后又一個(gè)重磅版本。據(jù)報(bào)道，文心大模型4.0進(jìn)展比預(yù)期快很多，將是基礎(chǔ)模型的大升級(jí)，理解、生成、邏輯、記憶核心能力都將提升，特別是在邏輯推理、代碼和數(shù)學(xué)等方面提升最明顯。

10月10日，記者從百度內(nèi)部人士基本確認(rèn)了該消息，據(jù)悉，即將推出的文心大模型4.0的參數(shù)量、訓(xùn)練數(shù)據(jù)量以及推理成本等都比3.5高出一個(gè)數(shù)量級(jí)。

今年3月16日，百度官宣新一代大語(yǔ)言模型“文心一言”啟動(dòng)邀測(cè)，8月31日正式面向公眾開放服務(wù)。如今，文心大模型即將再度升級(jí)發(fā)布4.0版，如此迅速的大模型升級(jí)速度，在國(guó)內(nèi)尚屬唯一。只不過，快速升級(jí)的背后，文心大模型4.0快速攀升的參數(shù)量、數(shù)據(jù)量所帶來的訓(xùn)練和推理成本提升，也正在成為大模型商業(yè)化過程中需要考慮的重點(diǎn)。

據(jù)此前消息報(bào)道，相比文心大模型3.5，文心4.0不僅訓(xùn)練成本在增加，推理成本也增加了很多，大概是此前的8-10倍。一直以來，百度并未對(duì)外披露大模型訓(xùn)練、推理的各項(xiàng)成本，不過據(jù)國(guó)盛證券此前估算，GPT-3訓(xùn)練一次的成本約為140萬美元，對(duì)于一些更大的LLM模型（如擁有2800億參數(shù)的Gopher和擁有5400億參數(shù)的PaLM），訓(xùn)練成本介于200萬美元至1200萬美元之間。作為國(guó)內(nèi)大語(yǔ)言模型代表，文心一言想要在性能上追趕甚至超越ChatGPT等國(guó)外同行，所需耗費(fèi)的資金成本，恐怕也將與之相當(dāng)。

過高的訓(xùn)練和推理成本壓力下，在打造領(lǐng)先的底層基礎(chǔ)大模型的路上，注定只能是一場(chǎng)巨頭間的游戲。不過對(duì)于百度而言，由于具備萬卡集群、飛槳、文心大模型以及豐富的百度應(yīng)用生態(tài)優(yōu)勢(shì)，獨(dú)具芯片、框架、模型及應(yīng)用四層架構(gòu)優(yōu)勢(shì)，更具技術(shù)競(jìng)爭(zhēng)力。

在進(jìn)一步降低大模型算力成本和時(shí)間成本上，百度萬卡集群的整體優(yōu)勢(shì)已得到充分體現(xiàn)——在萬卡集群訓(xùn)練大模型時(shí)，常規(guī)方法下工程師們有30%-40%時(shí)間都花在容錯(cuò)和故障恢復(fù)上，而在百度智能云自研的集群組網(wǎng)故障管理機(jī)制下，模型有效訓(xùn)練時(shí)間達(dá)到95%以上，人力及算力資源均得到了利用。

真金白銀投入的背后，目前國(guó)外大模型廠商已開始嘗試收費(fèi)模式，無論是在面向企業(yè)客戶的B端垂類大模型開發(fā)，還是面向消費(fèi)群體的To C付費(fèi)產(chǎn)品，均有不少案例。例如，在面向C端消費(fèi)者付費(fèi)領(lǐng)域，目前GPT-4已推出“每月支付20美元訂閱費(fèi)”的收費(fèi)模式。

可以預(yù)見，不遠(yuǎn)的將來，以百度為代表的大模型企業(yè)們，或?qū)㈥懤m(xù)推出收費(fèi)模式。在To C大模型AI應(yīng)用層面，類似愛奇藝或百度網(wǎng)盤VIP會(huì)員的收費(fèi)模式，也將不斷浮現(xiàn)，逐漸培養(yǎng)用戶付費(fèi)習(xí)慣。

本文轉(zhuǎn)載自：新浪證券，不代表科技訊之立場(chǎng)。原文鏈接：

參數(shù)文心大模型4.0 百度

AI認(rèn)證作者

0 0

商業(yè)

地平線機(jī)器人香港IPO獲阿里、百度等基石投資者支持

據(jù)彭博社報(bào)道，中國(guó)自動(dòng)駕駛系統(tǒng)軟件和硬件供應(yīng)商地平線機(jī)器人技術(shù)研發(fā)有限公司（以下簡(jiǎn)稱“地平線”）在香港IPO中成功吸引了阿里巴巴集團(tuán)控股和百度等基石投資者的支持。這一消息為地平線的…

商業(yè)頭條
2024年10月15日
新聞

百度宣布新一輪干部輪崗，百度健康事業(yè)群組將進(jìn)行結(jié)構(gòu)性調(diào)整

近日，百度公司宣布了新一輪的干部輪崗計(jì)劃。此次輪崗涉及多位高層管理人員，同時(shí)百度健康事業(yè)群組（HCG）也將進(jìn)行結(jié)構(gòu)性調(diào)整。根據(jù)百度官方消息，百度集團(tuán)執(zhí)行副總裁羅戎（Julius）…

NEWS
2024年10月9日
產(chǎn)品

百度官宣：2024世界大會(huì)定檔11月12日上海

今日，百度官方正式宣布，2024年百度世界大會(huì)將于11月12日在上海盛大舉行。這標(biāo)志著百度年度最高級(jí)別的行業(yè)峰會(huì)再次啟航，為全球科技愛好者、行業(yè)領(lǐng)袖、媒體及合作伙伴帶來一場(chǎng)前沿科技…

小科同學(xué)
2024年9月27日
新聞

百度文心一言App升級(jí)至4.0.0，更名為“文小言”

今日，百度宣布，其旗下智能搜索助手文心一言App正式迎來4.0.0版本升級(jí)，并更名為“文小言”。此次升級(jí)不僅帶來了名稱上的變化，更在功能上實(shí)現(xiàn)了全面飛躍，號(hào)稱“功能更強(qiáng)大，場(chǎng)景更豐…

李小白
2024年9月4日
商業(yè)

搜索營(yíng)銷市場(chǎng)大洗牌？

AI時(shí)代，搜索營(yíng)銷誰的天下？

藍(lán)鯊消費(fèi)
2024年8月14日
AI

百度、谷歌之后：微軟也要在Bing搜索結(jié)果中加入AI摘要

Bing生成搜索功能目前處于預(yù)覽階段，它通過AI技術(shù)為用戶提供搜索查詢的首選結(jié)果，并以原始響應(yīng)的形式呈現(xiàn)。

蘋果派
2024年7月26日
手機(jī)

realme GT7 Pro參數(shù)爆料：驍龍8 Gen4旗艦，攝影與續(xù)航新標(biāo)桿

近日，知名數(shù)碼博主@數(shù)碼閑聊站再度發(fā)文，曝光了realme即將推出的旗艦新機(jī)——realme GT7 Pro的部分核心參數(shù)信息。結(jié)合多方爆料與評(píng)論區(qū)反饋，這款搭載驍龍8 Gen4處…

校草
2024年7月26日
AI

百度推出仿真人AI社交App“文小言”：可與虛擬角色互動(dòng)并建立情感連接

近日消息，百度近期上線了一款名為“文小言”的 AI 數(shù)字人社交 App，其基于文心大模型技術(shù)打造，是一款與 AI 虛擬角色進(jìn)行實(shí)時(shí)溝通、互動(dòng)并建立情感連接的人工智能應(yīng)用服務(wù)。

潮玩君
2024年7月16日
AI

百度內(nèi)部人士：網(wǎng)傳武漢投放1000輛蘿卜快跑存疑，數(shù)量從未公開

7月10日下午消息，今日，百度蘿卜快跑登上微博熱搜，大量網(wǎng)友紛紛表示，伴隨無人駕駛的大面積普及，“五年后十年后，網(wǎng)約車、出租車基本都是無人駕駛的了，目前的網(wǎng)約車司機(jī)、出租車司機(jī)都得淘汰。

潮玩君
2024年7月10日
手機(jī)

realme真我13 Pro+大曝光：驍龍7s Gen 2領(lǐng)銜，曲面屏+多攝系統(tǒng)引期待

在智能手機(jī)市場(chǎng)持續(xù)升溫的當(dāng)下，realme再次攜重磅新品——真我13 Pro+強(qiáng)勢(shì)來襲，其詳細(xì)參數(shù)近日在電信設(shè)備終端網(wǎng)提前曝光，迅速吸引了業(yè)界的廣泛關(guān)注。這款新機(jī)不僅搭載了性能強(qiáng)勁…

小丸子
2024年7月5日
手機(jī)

Nothing CMF Phone 1相機(jī)配置曝光：索尼5000萬像素主攝引領(lǐng)影像新體驗(yàn)

今日，Nothing正式揭曉了其首款智能手機(jī)CMF Phone 1的相機(jī)參數(shù)，為期待已久的消費(fèi)者帶來了詳盡的影像性能預(yù)覽。據(jù)了解，CMF Phone 1相機(jī)配置上采用了獨(dú)特的左上角…

校草
2024年7月3日
產(chǎn)品

AMD RX 7800 XT vs NVIDIA RTX 4070：性價(jià)比與功能性的雙重對(duì)決

在顯卡市場(chǎng)，AMD與NVIDIA兩大巨頭始終在技術(shù)上競(jìng)相角逐，為玩家和專業(yè)人士提供不同選擇。今天，我們將聚焦于兩款同級(jí)別顯卡——AMD的RX 7800 XT和NVIDIA的RTX …

若安丶
2024年7月1日
手機(jī)

一加 Ace 3 Pro預(yù)熱：支持實(shí)況照片

今日，一加手機(jī)官方微博對(duì)一加 Ace 3 Pro進(jìn)行了最新預(yù)熱，新機(jī)支持實(shí)況照片、AI 消除、AI 摳圖等功能。一加 Ace 3 Pro 支持實(shí)況照片拍攝，可在小紅書平臺(tái)發(fā)布，支…

happy
2024年6月26日
新聞

蘋果WWDC24開發(fā)者大會(huì)即將揭幕，iOS 18或集成ChatGPT引關(guān)注

蘋果公司近日宣布，備受期待的WWDC24開發(fā)者大會(huì)將于北京時(shí)間6月11日凌晨1點(diǎn)正式開幕。作為一年一度的科技盛事，WWDC不僅是iOS開發(fā)者關(guān)注的焦點(diǎn)，也是蘋果生態(tài)用戶翹首以盼的盛…

Apple
2024年6月5日
新聞

百度萬象大會(huì)2024開幕，聚焦“智能體人人可用”

隨著人工智能技術(shù)的飛速發(fā)展，百度再次站在了行業(yè)前沿。據(jù)悉，2024百度移動(dòng)生態(tài)萬象大會(huì)于5月30日在美麗的蘇州盛大開幕，百度萬象大會(huì)2024以“讓智能體人人可用”為主題，旨在推動(dòng)智…

百度
2024年5月30日
AI

傳聞百度計(jì)劃于2025年發(fā)布文心大模型5.0

在人工智能領(lǐng)域的競(jìng)爭(zhēng)中，百度正積極推進(jìn)其核心技術(shù)研發(fā)。據(jù)可靠知情人士透露，百度或?qū)⒂?025年百度世界大會(huì)期間發(fā)布新一代文心大模型5.0，這一消息無疑將引起業(yè)界的廣泛關(guān)注。百度文…

百度
2024年5月29日
AI

百度文心一言正式上架統(tǒng)信應(yīng)用商店，推動(dòng)AI技術(shù)普及

近日，百度研發(fā)的人工智能大語(yǔ)言模型產(chǎn)品“文心一言”正式上架統(tǒng)信應(yīng)用商店，為用戶提供便捷的下載、安裝和使用服務(wù)。此次上架標(biāo)志著百度在AI領(lǐng)域的技術(shù)成果得到了統(tǒng)信UOS操作系統(tǒng)的認(rèn)可，…

百度
2024年5月28日
AI

百度文心大模型ENIRE Speed和ENIRE Lite全面免費(fèi)，加速AI應(yīng)用普及

在人工智能領(lǐng)域的激烈競(jìng)爭(zhēng)中，百度文心大模型近日宣布了一項(xiàng)重磅消息：其兩款主力模型ENIRE Speed和ENIRE Lite將全面免費(fèi)開放使用，即刻生效。這一舉措無疑將對(duì)整個(gè)行業(yè)產(chǎn)…

百度
2024年5月21日
產(chǎn)品

Meta Quest 3s“入門版”VR頭顯曝光：新增攝像頭與升級(jí)SoC，售價(jià)親民

在虛擬現(xiàn)實(shí)（VR）市場(chǎng)日益競(jìng)爭(zhēng)激烈的背景下，Meta（前Facebook）不斷推出新款設(shè)備來鞏固其市場(chǎng)領(lǐng)導(dǎo)地位。近日，Meta即將發(fā)布的Quest 3s“入門版”VR頭顯引發(fā)了業(yè)界…

泡沫大盜
2024年5月21日
新聞

百度資深副總裁梁志祥暫接公關(guān)業(yè)務(wù)，原公關(guān)副總裁璩靜離職

百度近日發(fā)生高層人事變動(dòng)。據(jù)媒體報(bào)道，在百度原公關(guān)副總裁璩靜因短視頻爭(zhēng)議言論離職后，百度資深副總裁梁志祥已暫時(shí)接管公關(guān)業(yè)務(wù)。目前尚不清楚這一接管是臨時(shí)性措施以尋找下一位公關(guān)負(fù)責(zé)人，…

百度
2024年5月21日