英偉達發(fā)布80億參數(shù)新AI模型：精度、效率高，可在RTX工作站上部署

科技探索者 ? 2024年8月23日 13:21:00 ? AI

英偉達攜手 Mistral AI 上月發(fā)布開源 Mistral NeMo 12B 模型，在此基礎(chǔ)上英偉達再次推出更小的 Mistral-NeMo-Minitron 8B 模型，共 80 億個參數(shù)，可以在搭載英偉達 RTX 顯卡的工作站上運行。

8 月 23 日消息，英偉達于 8 月 21 日發(fā)布博文，發(fā)布了 Mistral-NeMo-Minitron 8B 小語言 AI 模型，具備精度高、計算效率高等優(yōu)點，可在 GPU 加速的數(shù)據(jù)中心、云和工作站上運行模型。

英偉達表示通過寬度剪枝（width-pruning）Mistral NeMo 12B，并知識蒸餾（knowledge distillation）輕度重新訓練后獲得 Mistral-NeMo-Minitron 8B，相關(guān)成果發(fā)表在《Compact Language Models via Pruning and Knowledge Distillation》論文中。

剪枝通過去除對準確率貢獻最小的模型權(quán)重來縮小神經(jīng)網(wǎng)絡(luò)。在 “蒸餾” 過程中，研究小組在一個小型數(shù)據(jù)集上重新訓練剪枝后的模型，以顯著提高通過剪枝過程而降低的準確率。

就其規(guī)模而言，Mistral-NeMo-Minitron 8B 在語言模型的九項流行基準測試中遙遙領(lǐng)先。這些基準涵蓋了各種任務(wù)，包括語言理解、常識推理、數(shù)學推理、總結(jié)、編碼和生成真實答案的能力。附上相關(guān)測試結(jié)果如下：

英偉達發(fā)布80億參數(shù)新AI模型：精度、效率高，可在RTX工作站上部署

參考

Lightweight Champ: NVIDIA Releases Small Language Model With State-of-the-Art Accuracy

Mistral-NeMo-Minitron 8B Foundation Model Delivers Unparalleled Accuracy

Compact Language Models via Pruning and Knowledge Distillation

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/675651.html

科技探索者管理團隊

0 0

產(chǎn)品

?英偉達RTX 5060系列顯卡發(fā)布：299美元起售

昨日晚，英偉達正式發(fā)布GeForce RTX 5060系列桌面顯卡，包含RTX 5060 8GB、RTX 5060 Ti 8GB及RTX 5060 Ti 16GB三款型號，起售價為…

AI
1天前
商業(yè)

科技七姐妹遭“黑色48小時”：蘋果單日市值蒸發(fā)4159億美元

近日，美股經(jīng)歷劇烈震蕩，被稱為“七姐妹”的科技巨頭蘋果、英偉達、Meta、谷歌、微軟、亞馬遜、特斯拉在4月4日至5日兩個交易日內(nèi)市值蒸發(fā)1.5萬億美元。這場風暴導致納斯達克綜合指數(shù)…

商業(yè)頭條
2025年4月7日
新聞

螞蟻集團AI訓練大突破：國產(chǎn)芯片替代英偉達，成本直降20%

據(jù)彭博社援引知情人士消息，螞蟻集團正通過中國自主研發(fā)的芯片開發(fā)AI模型訓練技術(shù)，成功將成本壓縮20%。其訓練效果已與英偉達H800芯片相當，標志著國產(chǎn)芯片在高端AI領(lǐng)域的重大突破?！?/p>

AI
2025年3月24日
產(chǎn)品

英偉達RTX 5060 Ti雙顯存版官宣：4月16日同步上市

北京時間3月22日，X平臺知名科技爆料人Алексей (@wxnod) 發(fā)布最新消息稱，英偉達已確定于?4月16日?正式發(fā)布GeForce RTX 5060 Ti桌面端顯卡，且?…

AI
2025年3月24日
商業(yè)

英偉達重金收購AI數(shù)據(jù)公司Gretel，生成式模型訓練添“彈藥庫”

據(jù)外媒報道，全球AI芯片巨頭英偉達（Nvidia）近日完成對合成數(shù)據(jù)企業(yè)Gretel的收購。據(jù)《連線》雜志報道，本次交易金額達九位數(shù)美元，超過Gretel最新3.2億美元（約23.…

商業(yè)頭條
2025年3月21日
AI

DeepMind資深科學家離職創(chuàng)辦機器人公司Generalist AI，獲NVentures投資

谷歌DeepMind前機器人科學家Pete Florence近日宣布創(chuàng)立AI機器人公司Generalist AI，并已獲得英偉達旗下風投機構(gòu)NVentures的戰(zhàn)略投資。這家初創(chuàng)公…

AI
2025年3月20日
AI

GTC 2025大會：機器人Blue亮相

在英偉達GTC 2025大會上，機器人Blue亮相。據(jù)了解，英偉達CEO黃仁勛在GTC 2025大會壓軸環(huán)節(jié)放出“大招”——聯(lián)合谷歌DeepMind、迪士尼共同發(fā)布名為Newton…

AI
2025年3月20日
產(chǎn)品

英偉達Nvidia宣布推出Blackwell Ultra和Rubin AI芯片

昨日，英偉達NVIDIA首席執(zhí)行官黃仁勛在年度GTC技術(shù)大會上宣布多項重磅產(chǎn)品規(guī)劃：Blackwell Ultra芯片系列將于今年下半年面世，下一代圖形處理器Vera Rubin預…

AI
2025年3月20日
新聞

黃仁勛再談DeepSeek：新型AI對算力的渴求只會更強

在英偉達年度技術(shù)盛會GTC 2025大會上，黃仁勛再談DeepSeek。公司創(chuàng)始人兼CEO黃仁勛在主題演講中直面行業(yè)爭議，針對近期科技圈熱議的”DeekSeek公司R1…

野游栗
2025年3月20日
AI

英偉達發(fā)布基于DeepSeek-R1 AI推理系統(tǒng) 創(chuàng)全球性能新紀錄

在3月19日舉行的NVIDIA GTC 2025技術(shù)大會上，英偉達正式推出基于DeepSeek-R1大模型的AI推理系統(tǒng)。官方披露，搭載八塊Blackwell架構(gòu)GPU的NVIDI…

AI
2025年3月19日
商業(yè)

英偉達GTC大會今日開幕！黃仁勛將發(fā)布新一代AI芯片，股價波動引關(guān)注

今日，英偉達（NVDA）年度GTC技術(shù)大會正式召開。此前一個交易日（3月17日），英偉達股價下跌1.8%，收于119.51美元，亞馬遜、Meta等科技股同步走低。不過，該公司股價上…

李小白
2025年3月18日
新聞

鴻海宣布英偉達GB200 AI服務(wù)器量產(chǎn)達標下半年啟動全球交付

鴻海精密工業(yè)股份有限公司董事長劉揚偉在3月14日舉行的法人說明會上正式宣布，英偉達GB200人工智能服務(wù)器已通過量產(chǎn)驗證，首批產(chǎn)品將于今年第三季度向客戶交付。他表示，經(jīng)過對全球12…

小科同學
2025年3月15日
AI

?英偉達官宣新一代AI芯片Rubin：以暗物質(zhì)先驅(qū)女科學家命名

據(jù)CNBC報道，英偉達CEO黃仁勛將于?3月19日GTC大會?正式發(fā)布新一代AI芯片平臺“Rubin”，其命名源自暗物質(zhì)研究先驅(qū)、美國天文學家薇拉·魯賓（Vera Rubin）。這…

AI
2025年3月14日
新聞

臺積電聯(lián)手英偉達/AMD洽購英特爾代工業(yè)務(wù)，后者股價暴漲超10%

據(jù)路透社援引知情人士消息稱，臺積電正聯(lián)合英偉達、AMD、博通等芯片巨頭，就組建合資公司接管英特爾晶圓代工部門展開談判。受此消息刺激，英特爾美股夜盤短線飆升超10%，創(chuàng)近三個月最大單…

小丸子
2025年3月12日
新聞

臺積電2月份營收79億美元同比繼續(xù)大增但環(huán)比有下滑

臺積電2月份營收大增43.1%，環(huán)比下滑11.3%，同比增長率超過30%，前兩個月營收5532.97億新臺幣，高于去年同期的3974.33億。

秋秋
2025年3月10日
產(chǎn)品

?英偉達RTX 5060 Ti/5050顯卡參數(shù)全曝光：4月上市在即

今日，知名爆料人@kopite7kimi在X平臺發(fā)布英偉達GeForce RTX 5060 Ti與RTX 5050顯卡完整參數(shù)，確認兩款產(chǎn)品將基于全新“Blackwell”架構(gòu)的G…

AI
2025年3月10日
產(chǎn)品

?英偉達回應RTX 50移動顯卡ROP爭議：否認缺陷，強調(diào)標準檢測流程

據(jù)德國媒體Heise Online報道稱，英偉達RTX 50系列筆記本GPU疑似存在與桌面版相同的ROP（光柵處理單元）缺失問題，可能導致光柵化性能下降。消息稱，英偉達已要求遠東地…

happy
2025年3月7日
產(chǎn)品

英偉達RTX 5070非公版今晚全球上市，性能實測不及預期

今日，英偉達 GeForce RTX 5070 顯卡正式解禁，并計劃于當晚 22:00全球上市。但官方確認，原定的 RTX 5070 FE 創(chuàng)始人版（公版）將推遲至 3 月下旬發(fā)售…

野游栗
2025年3月5日
商業(yè)

英偉達市值一夜蒸發(fā)近2萬億元

美東時間2月26日周三盤后，英偉達發(fā)布2025財年（對應自然年2024年）第四財季及全年財報。數(shù)據(jù)顯示，第四財季營收達393.31億美元，同比大增78%，遠超市場預期的380.5億…

野游栗
2025年3月4日
新聞

英偉達市值疑似受DeepSeek崛起影響而暴跌超8% 一夜蒸發(fā)近2萬億元

2月28日，當?shù)貢r間2月27日，美國科技巨頭股價集體下跌，其中AI芯片龍頭企業(yè)英偉達股價重挫8.48%，創(chuàng)下一個月來最大單日跌幅，市值蒸發(fā)約2716億美元（約合1.98萬億元人民幣…

檸萌
2025年2月28日