谷歌最新AI大語言模型數(shù)據(jù)量擴充5倍

蘋果派 ? 2023年5月17日 01:18:38 ? 新聞

谷歌上周發(fā)布的最新大語言模型使用的訓(xùn)練數(shù)據(jù)，幾乎是2022年的上一代模型的5倍

5月17日早間消息，據(jù)報道，谷歌上周發(fā)布的最新大語言模型使用的訓(xùn)練數(shù)據(jù)，幾乎是2022年的上一代模型的5倍。得益于此，該模型在編程、數(shù)學(xué)和創(chuàng)意寫作方面的表現(xiàn)更為優(yōu)秀。

谷歌是在其I/O開發(fā)者大會上發(fā)布最新通用大語言模型PaLM2的。內(nèi)部文件顯示，該模型采用了3.6萬億個令牌（token）進行訓(xùn)練。令牌指的是單詞串，這是訓(xùn)練大語言模型的重要基礎(chǔ)，因為這可以教給模型如何預(yù)測字符串中可能出現(xiàn)的下一個單詞。

之前版本的PaLM發(fā)布于2022年，當(dāng)時使用的令牌為7800億個。

雖然谷歌很希望展示其人工智能技術(shù)的實力，以及嵌入搜索、電子郵件、字處理和電子表格后的效果，但該公司卻不愿發(fā)布其訓(xùn)練數(shù)據(jù)的規(guī)模和其他細(xì)節(jié)。微軟支持的OpenAI也對其最新的GPT-4大語言模型的細(xì)節(jié)信息保密。

這些公司表示，之所以不披露這些信息，是出于商業(yè)競爭考慮。谷歌和OpenAI都在努力吸引想要用聊天機器人代替?zhèn)鹘y(tǒng)搜索引擎，從而直接獲取答案的用戶。

但隨著人工智能軍備競賽日趨白熱化，相關(guān)研究人員也呼吁企業(yè)加大透明度。

自從發(fā)布PaLM2之后，谷歌一直表示新的模型比之前的大語言模型更小，這就意味著該公司的技術(shù)效率得以提升，但卻可以完成更加復(fù)雜的任務(wù)。內(nèi)部文件顯示，PaLM2基于3400億個參數(shù)訓(xùn)練——這項指標(biāo)可以說明該模型的復(fù)雜程度。最初的PaLM則基于5400億個參數(shù)訓(xùn)練。

目前，谷歌尚未對此置評。

谷歌在一篇關(guān)于PaLM2的博文中表示，該模型使用了一種名為“計算機優(yōu)化擴張”的新技術(shù)。這就讓大語言“更高效、整體性能更好，包括加快推理速度、減少參數(shù)調(diào)用和降低服務(wù)成本?！?/p>

在宣布PaLM2時，谷歌證實了此前的媒體報道，計該模型針對100種語言進行訓(xùn)練，可以執(zhí)行更廣泛的任務(wù)。它已經(jīng)被用于25項功能和產(chǎn)品，包括該公司的實驗性聊天機器人Bard。按照從小到大的規(guī)模劃分，該模型共有4種，分別是壁虎（Gecko）、水獺（Otter）、野牛（Bison）和獨角獸（Unicorn）。

根據(jù)公開披露的信息，PaLM2比現(xiàn)有的任何模型都更加強大。Facebook在2月份宣布的的LLaMA大語言模型采用1.4萬億個令牌。OpenAI上一次披露GPT-3的訓(xùn)練規(guī)模時表示，它當(dāng)時基于3000億個令牌。OpenAI今年3月發(fā)布GPT-4時表示，它在許多專業(yè)測試中展示出“與人類媲美的表現(xiàn)”。

LaMDA是谷歌兩年前推出的一個對話型大語言模型，在今年2月還與Bard一同對外宣傳。該模型基于1.5萬億個令牌訓(xùn)練。

隨著新的人工智能應(yīng)用快速進入主流，圍繞底層技術(shù)的爭議也越來越激烈。

谷歌高級研究科學(xué)家艾爾·邁赫迪·艾爾·麥哈麥迪（El Mahdi El Mhamdi）于今年2月辭職，主要原因就是人工智能技術(shù)缺乏透明度。本周二，OpenAI CEO山姆·阿爾特曼（Sam Altman）出席美國國會針對隱私和技術(shù)舉行的聽證會，他也認(rèn)為需要設(shè)立一套新的制度來應(yīng)對人工智能的潛在問題。

“對于一種全新的技術(shù)，我們需要一套全新的框架?！卑柼芈f，“當(dāng)然，像我們這樣的公司應(yīng)當(dāng)為我們推出的工具承擔(dān)許多責(zé)任?！?/p>

原創(chuàng)文章，作者：蘋果派，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/571645.html

OpenAI 微軟谷歌

蘋果派管理團隊

0 0

產(chǎn)品

傳聞微軟計劃與華碩、聯(lián)想合作推出Xbox游戲掌機設(shè)備

據(jù)外媒報道，微軟正在與華碩、聯(lián)想等在游戲掌機領(lǐng)域具有豐富經(jīng)驗的廠商進行洽談，計劃合作推出Xbox掌機。不過，目前關(guān)于這款掌機的具體信息并不明了，存在多種可能性。據(jù)了解，這款Xbo…

Microsoft
15小時前
AI

OpenAI GPT-5研發(fā)受阻，成本高昂效果未及預(yù)期

近日，《華爾街日報》報道稱，OpenAI正在研發(fā)的下一代大型語言模型GPT-5遭遇研發(fā)難題，進度滯后且成果未達預(yù)期。這一消息與此前有關(guān)GPT-5可能無法實現(xiàn)顯著性能飛躍的報道相呼應(yīng)…

AI
1天前
新聞

Windows 11 十二月更新引發(fā)新問題

近日，微軟發(fā)布的 Windows 11 十二月更新遭遇了新的困擾。據(jù) Windows Latest 報道，此次更新導(dǎo)致開始菜單響應(yīng)遲緩甚至停止工作，同時游戲性能也有所下降。受影響…

Microsoft
1天前
新聞

谷歌YouTube印度站將嚴(yán)厲打擊“標(biāo)題黨”“封面黨”

近日，谷歌在其YouTube印度博客網(wǎng)站上發(fā)布了一則重要公告，宣布將針對平臺上長期存在的“標(biāo)題黨”“封面黨”視頻進行嚴(yán)厲打擊。谷歌指出，這些視頻往往制作粗糙、內(nèi)容空洞，僅僅依靠夸…

Google
2天前
AI

意大利對OpenAI罰款1500萬歐元，因ChatGPT數(shù)據(jù)隱私違規(guī)

近日，意大利數(shù)據(jù)保護機構(gòu)Garante發(fā)布公告，宣布對OpenAI處以1500萬歐元（約合1.14億元人民幣）的罰款。這一處罰是在對生成式AI應(yīng)用使用個人數(shù)據(jù)情況進行調(diào)查后做出的。…

NEWS
2天前
AI

谷歌Gemini AI深度研究模式新增支持中文等40多種語言

谷歌公司近日宣布，其旗下的Gemini AI深度研究模式現(xiàn)已新增支持中文等40多種語言。這一功能旨在為用戶提供強大的AI研究輔助能力，并已向Google One AI高級計劃用戶開…

Google
2天前
AI

OpenAI更新macOS版ChatGPT，新增備忘錄及IDE支持

OpenAI近日對其macOS版ChatGPT應(yīng)用進行了更新，新增了支持讀取macOS系統(tǒng)集成的備忘錄App（Apple Notes）及第三方備忘錄App如Notion等功能?，F(xiàn)在…

AI
2天前
AI

桌面版ChatGPT功能大升級：新增30余應(yīng)用支持

在OpenAI的“12天活動”進入尾聲，在活動倒數(shù)第二天，公司展示了桌面版ChatGPT的功能改進。此次演示強調(diào)，ChatGPT正逐步從聊天機器人向AI智能體工具轉(zhuǎn)變，旨在桌面環(huán)境…

AI
3天前
新聞

消息稱Win10/Win11新版Outlook將于2025年1月更新

據(jù)最新消息，微軟計劃在2025年1月對其Windows 10和Windows 11系統(tǒng)上的Outlook電子郵件應(yīng)用進行重大更新。此次更新將帶來一系列實用的新功能，旨在提升用戶的辦…

Microsoft
3天前
新聞

Windows 11 24H2更新遇阻，Auto HDR功能引發(fā)游戲兼容性問題

近日，微軟在官方 Windows 健康儀表板網(wǎng)站上發(fā)布通知，指出 Windows 11 24H2 版本存在游戲兼容性問題，決定暫停向部分設(shè)備推送更新。據(jù)了解，問題源于 Auto …

Microsoft
4天前
新聞

微軟發(fā)布Windows 11 Dev 26120.2705 預(yù)覽版更新：新增功能與優(yōu)化改進

昨日（12 月 18 日），微軟公司發(fā)布博文稱，面向 Dev 頻道的 Windows Insider 項目成員，發(fā)布了適用于Windows 11的KB5050636更新，用戶安裝后…

Microsoft
4天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
5天前
AI

傳聞Google Tensor G5或?qū)売萌峭ㄓ嵞＝M，轉(zhuǎn)投聯(lián)發(fā)科T900

近日，有關(guān)Google Tensor G5處理器的最新消息傳出。據(jù)外媒報道，Google在綜合考慮了多種通訊模組選項后，決定在Tensor G5處理器上采用聯(lián)發(fā)科尚未發(fā)布的T900…

Google
5天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個新模型在理解現(xiàn)實世界物理、人類運動和表達的細(xì)微差別方面表現(xiàn)更出色，從而能夠進一步提升視頻整體的細(xì)節(jié)和逼真度?！?/p>

Google
6天前
產(chǎn)品

谷歌Astra智能眼鏡曝光，將融合AI與AR技術(shù)

今日，有消息稱，谷歌DeepMind網(wǎng)站為Project Astra項目開辟了新的測試頻道，打算邀請部分用戶對Astra智能眼鏡進行測試。據(jù)了解，這款原型眼鏡融合了AI和AR技術(shù)，…

Google
6天前
AI

OpenAI向所有用戶開放ChatGPT搜索功能

在“OpenAI 12天”活動進展到第8天的時候，OpenAI發(fā)布了一則重要消息，現(xiàn)在所有登錄用戶都能夠使用ChatGPT搜索功能了。 OpenAI此次免費向所有用戶開放ChatG…

AI
6天前
AI

ChatGPT搜索引擎向所有用戶免費開放：新增實時搜索和高級語音功能

OpenAI推出搜索引擎工具，ChatGPT搜索功能獲大量更新，由GPT-4o模型支持，可快速獲取實時內(nèi)容，支持高級語音模式，移動端使用效率提升40%以上。

潮玩君
6天前
新聞

谷歌推送Android 15 QPR2 Beta 2更新，多設(shè)備可享

今日，谷歌針對Pixel設(shè)備推出了Android 15 QPR2 Beta 2更新，版本號為BP11.241121.010。QPR是季度平臺發(fā)布，能讓用戶提前體驗Pixel Fea…

Android
6天前
手機

谷歌Pixel 10系列傳聞：或采用聯(lián)發(fā)科T900調(diào)制解調(diào)器

有外媒近日報道了一則關(guān)于谷歌Pixel 10系列傳聞的最新消息。據(jù)谷歌內(nèi)部消息人士透露，谷歌計劃在下一代Pixel手機中放棄高通和三星的調(diào)制解調(diào)器方案，轉(zhuǎn)而選擇聯(lián)發(fā)科尚未發(fā)布的T9…

Google
2024年12月16日
新聞

微軟MFA系統(tǒng)曝AuthQuake重大安全漏洞，涉及多重認(rèn)證的賬號驗證器動態(tài)碼系統(tǒng)

有消息稱，安全公司Oasis近日曝光了微軟MFA多重驗證系統(tǒng)中存在的一項名為AuthQuake的重大安全漏洞。據(jù)稱，該漏洞允許黑客通過窮舉暴力破解驗證碼的方式繞過驗證流程，進而訪問…

Microsoft
2024年12月15日

谷歌最新AI大語言模型數(shù)據(jù)量擴充5倍

相關(guān)推薦