英偉達(dá)推出高效小語(yǔ)言AI模型Mistral-NeMo-Minitron 8B

好奇寶寶 ? 2024年8月23日 17:22:00 ? 新聞

全球領(lǐng)先的圖形處理器（GPU）制造商英偉達(dá)公司近日宣布了一項(xiàng)重要進(jìn)展，成功發(fā)布了名為Mistral-NeMo-Minitron 8B的小型語(yǔ)言AI模型。這款模型以其高精度和高計(jì)算效率為特點(diǎn)，標(biāo)志著AI技術(shù)在資源有限環(huán)境下的應(yīng)用邁出了重要一步。

據(jù)英偉達(dá)官方介紹，Mistral-NeMo-Minitron 8B模型擁有80億個(gè)參數(shù)，是英偉達(dá)在之前與Mistral AI合作推出的120億參數(shù)Mistral NeMo 12B模型基礎(chǔ)上，通過(guò)先進(jìn)的寬度剪枝（width-pruning）和知識(shí)蒸餾（knowledge distillation）技術(shù)優(yōu)化而來(lái)。這一成果不僅展示了英偉達(dá)在AI模型壓縮和加速領(lǐng)域的深厚實(shí)力，也為AI技術(shù)在更廣泛場(chǎng)景下的應(yīng)用提供了可能。

寬度剪枝技術(shù)通過(guò)去除對(duì)模型準(zhǔn)確率貢獻(xiàn)最小的權(quán)重，有效減小了神經(jīng)網(wǎng)絡(luò)的規(guī)模。而知識(shí)蒸餾則通過(guò)在一個(gè)小型數(shù)據(jù)集上重新訓(xùn)練剪枝后的模型，顯著提升了其因剪枝而降低的準(zhǔn)確率。英偉達(dá)在《Compact Language Models via Pruning and Knowledge Distillation》論文中詳細(xì)闡述了這一創(chuàng)新過(guò)程，為業(yè)界提供了寶貴的參考。

在性能表現(xiàn)上，Mistral-NeMo-Minitron 8B模型展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力。在包括語(yǔ)言理解、常識(shí)推理、數(shù)學(xué)推理、總結(jié)、編碼以及生成真實(shí)答案在內(nèi)的九項(xiàng)流行基準(zhǔn)測(cè)試中，該模型均取得了優(yōu)異的成績(jī)，遙遙領(lǐng)先于其他同類模型。這一結(jié)果充分證明了Mistral-NeMo-Minitron 8B模型在保持高精度的同時(shí)，也具備了極高的計(jì)算效率。

尤為值得一提的是，Mistral-NeMo-Minitron 8B模型可以在搭載英偉達(dá)RTX顯卡的工作站上運(yùn)行，這意味著用戶無(wú)需投入高昂的成本即可享受到AI技術(shù)帶來(lái)的便利。這一特性無(wú)疑將極大地推動(dòng)AI技術(shù)在中小企業(yè)、科研機(jī)構(gòu)以及個(gè)人用戶中的普及和應(yīng)用。

英偉達(dá)此次發(fā)布的Mistral-NeMo-Minitron 8B模型，不僅是對(duì)現(xiàn)有AI技術(shù)的一次重要突破，更是對(duì)未來(lái)AI發(fā)展趨勢(shì)的一次有力探索。隨著技術(shù)的不斷進(jìn)步和應(yīng)用的不斷拓展，我們有理由相信AI技術(shù)將在更多領(lǐng)域發(fā)揮出更大的作用和價(jià)值。

原創(chuàng)文章，作者：好奇寶寶，如若轉(zhuǎn)載，請(qǐng)注明出處：http://2079x.cn/article/675780.html

AI GPU Mistral-NeMo-Minitron 8B 英偉達(dá)

好奇寶寶認(rèn)證作者

0 0

新聞

消息稱字節(jié)跳動(dòng)旗下AI Lab全員并入Seed團(tuán)隊(duì)，百萬(wàn)年薪搶博士備戰(zhàn)大模型

近日，據(jù)知情人士透露，字節(jié)跳動(dòng)啟動(dòng)新一輪AI組織架構(gòu)調(diào)整，原核心AI研發(fā)部門AI Lab將全部并入大模型研發(fā)團(tuán)隊(duì)Seed。此次整合意味著字節(jié)AI資源進(jìn)一步向大模型領(lǐng)域集中，為技術(shù)攻…

好奇寶寶
14小時(shí)前
出海

?阿里旗下Lazada推出“Lazzie Seller” 助商家一鍵提效

近日，阿里巴巴集團(tuán)旗下東南亞電商平臺(tái)Lazada正式推出商家專用AI助理Lazzie Seller。這款工具基于自然語(yǔ)言處理技術(shù)，可實(shí)時(shí)響應(yīng)商家在店鋪運(yùn)營(yíng)中的各類問(wèn)題，包括功能操作…

小丸子
15小時(shí)前
產(chǎn)品

?英偉達(dá)RTX 5060系列顯卡發(fā)布：299美元起售

昨日晚，英偉達(dá)正式發(fā)布GeForce RTX 5060系列桌面顯卡，包含RTX 5060 8GB、RTX 5060 Ti 8GB及RTX 5060 Ti 16GB三款型號(hào)，起售價(jià)為…

AI
16小時(shí)前
出海

?eBay上線“魔法上架”工具：拍照就能賣貨，AI秒填商品詳情

全球電商平臺(tái)eBay近日宣布推出一項(xiàng)革新性功能——搭載“Magical Listing AI技術(shù)”的智能銷售工具，通過(guò)人工智能技術(shù)大幅簡(jiǎn)化商品發(fā)布流程，幫助賣家實(shí)現(xiàn)“拍照即上架”的…

聆聽(tīng)
20小時(shí)前
商業(yè)

OpenAI前首席科學(xué)家創(chuàng)企SSI首輪融資20億美元谷歌英偉達(dá)聯(lián)手押注

由OpenAI前首席科學(xué)家伊利亞·蘇茨克沃創(chuàng)立的AI公司Safe Superintelligence（SSI）近日完成首輪融資，以20億美元（約合2334.5億元人民幣）創(chuàng)下AI初…

李小白
3天前
新聞

谷歌母公司豪擲750億美元買芯片，全力沖刺AI數(shù)據(jù)中心建設(shè)

近日，谷歌母公司Alphabet宣布，今年將按計(jì)劃投入750億美元（約合5519億元人民幣）擴(kuò)建全球數(shù)據(jù)中心，重點(diǎn)采購(gòu)芯片、服務(wù)器等硬件，以支撐生成式AI及核心業(yè)務(wù)發(fā)展。這是繼今年…

net
6天前
產(chǎn)品

Adobe官宣AI編輯助手：為Photoshop和Premiere Pro提供編輯建議并自動(dòng)執(zhí)行操作

全球創(chuàng)意軟件巨頭Adobe今日宣布，正為Photoshop和Premiere Pro開發(fā)新一代AI助手“創(chuàng)意代理”。該功能將徹底改變傳統(tǒng)修圖和視頻剪輯的工作流，通過(guò)智能建議與自動(dòng)化…

AI
6天前
AI

AI繪圖模型即夢(mèng)3.0上線，中文海報(bào)直出驚現(xiàn)像素級(jí)排版

近日，國(guó)內(nèi)AI繪圖領(lǐng)域迎來(lái)震撼突破——即夢(mèng)3.0模型突襲開啟灰度測(cè)試。該模型憑借中文直出能力引發(fā)設(shè)計(jì)圈震動(dòng)，多位設(shè)計(jì)師在社交平臺(tái)曬出含立體字、藝術(shù)字的完整電商海報(bào)，所有中文字符均由…

AI
2025年4月7日
商業(yè)

科技七姐妹遭“黑色48小時(shí)”：蘋果單日市值蒸發(fā)4159億美元

近日，美股經(jīng)歷劇烈震蕩，被稱為“七姐妹”的科技巨頭蘋果、英偉達(dá)、Meta、谷歌、微軟、亞馬遜、特斯拉在4月4日至5日兩個(gè)交易日內(nèi)市值蒸發(fā)1.5萬(wàn)億美元。這場(chǎng)風(fēng)暴導(dǎo)致納斯達(dá)克綜合指數(shù)…

商業(yè)頭條
2025年4月7日
AI

Meta發(fā)布Llama 4系列AI模型，包含三款

近日，科技領(lǐng)域迎來(lái)新動(dòng)態(tài)，Meta正式發(fā)布旗下最新Llama 4系列AI模型，包含Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款…

AI
2025年4月6日
AI

ChatGPT Plus向美加大學(xué)生提供免費(fèi)服務(wù)，至5月31日

OpenAI首席執(zhí)行官山姆·阿爾特曼于4月4日通過(guò)社交平臺(tái)X宣布，即日起至5月31日，加拿大及美國(guó)在校大學(xué)生可免費(fèi)使用ChatGPT Plus服務(wù)。這一教育專項(xiàng)計(jì)劃覆蓋兩國(guó)逾300…

AI
2025年4月5日
商業(yè)

孫正義再砸千億豪賭A：軟銀165億美金打造”星際之門”

當(dāng)?shù)貢r(shí)間4月1日，日本軟銀集團(tuán)被曝啟動(dòng)史上最大規(guī)模美元融資，擬籌集165億美元（約合1200億元人民幣）建設(shè)名為”星際之門”的AI超級(jí)計(jì)算項(xiàng)目。這將成為繼2…

商業(yè)頭條
2025年4月2日
新聞

蘋果Apple Intelligence全球開放，支持8種語(yǔ)言

北京時(shí)間4月1日，蘋果公司向全球用戶推送重大更新，搭載在iOS 18.4等三大系統(tǒng)的Apple Intelligence人工智能服務(wù)正式支持中文等8種語(yǔ)言。這意味著中國(guó)、歐盟、日韓…

Apple
2025年4月2日
AI

Runway發(fā)布Gen-4視頻模型：角色一致性突破，好萊塢合作加速AI電影創(chuàng)作

當(dāng)?shù)貢r(shí)間周一，AI初創(chuàng)公司Runway正式推出新一代視頻生成模型Gen-4，宣稱其可生成“保真度最高、角色場(chǎng)景高度一致”的AI視頻。該模型已向個(gè)人和企業(yè)用戶開放，試圖在競(jìng)爭(zhēng)激烈的A…

AI
2025年4月1日
AI

Manus正式開啟AI服務(wù)收費(fèi)：39美元入門套餐可同時(shí)處理雙任務(wù)

中國(guó)AI初創(chuàng)企業(yè)Manus近日公布了首套收費(fèi)方案，推出Starter和Pro兩款套餐，標(biāo)志著其AI Agent產(chǎn)品結(jié)束預(yù)覽期進(jìn)入商業(yè)化階段。該方案采用積分制計(jì)費(fèi)，39美元基礎(chǔ)套餐允…

AI
2025年4月1日
AI

ChatGPT免費(fèi)開放AI作畫，吉卜力風(fēng)格火爆全網(wǎng)

OpenAI旗下ChatGPT的AI圖像生成功能近日全面向免費(fèi)用戶開放，其高度還原的“吉卜力動(dòng)畫風(fēng)格”引發(fā)全球用戶爭(zhēng)相體驗(yàn)，但同時(shí)也招致日本動(dòng)畫大師宮崎駿及粉絲的強(qiáng)烈批評(píng)。據(jù)IT…

AI
2025年3月31日
AI

Manus AI估值暴漲5倍，中國(guó)獨(dú)角獸沖刺硅谷融資

人工智能新銳Manus AI正引發(fā)資本市場(chǎng)關(guān)注。據(jù)The Information 報(bào)道，這家由北京創(chuàng)業(yè)公司蝴蝶效應(yīng)（Butterfly Effect）開發(fā)的AI企業(yè)，正在與美國(guó)風(fēng)投…

AI
2025年3月30日
新聞

英國(guó)AI雄心遇“攔路虎”，28%政府系統(tǒng)老舊拖后腿

據(jù)外媒TechRadar報(bào)道，英國(guó)公共賬目委員會(huì)（PAC）最新報(bào)告顯示，該國(guó)政府推廣人工智能的雄心正面臨傳統(tǒng)IT系統(tǒng)老化、數(shù)據(jù)質(zhì)量低下及共享受限等現(xiàn)實(shí)阻礙。報(bào)告稱，英國(guó)中央政府約…

聆聽(tīng)
2025年3月29日
AI

?豆包上線“深度思考”新技能：邊搜索邊推理破解復(fù)雜問(wèn)題

字節(jié)跳動(dòng)旗下智能助手豆包今日宣布，新版“深度思考”功能正式開啟測(cè)試。該功能將推理過(guò)程的思維鏈與實(shí)時(shí)搜索結(jié)合，實(shí)現(xiàn)“邊思考邊搜索”，可多次調(diào)用工具并整合信息，顯著提升復(fù)雜問(wèn)題處理精度…

AI
2025年3月28日
新聞

傳聞寶馬聯(lián)手阿里升級(jí)新世代車型通義大模型驅(qū)動(dòng)車載AI革新

據(jù)多方消息披露，寶馬集團(tuán)與阿里巴巴已達(dá)成全面AI合作協(xié)議，阿里通義大模型將深度整合至寶馬面向中國(guó)市場(chǎng)的新世代系列車型。這意味著雙方將共同推進(jìn)智能座艙、語(yǔ)音交互等車載系統(tǒng)的AI化升級(jí)…

小丸子
2025年3月26日

發(fā)表回復(fù)

登錄后才能評(píng)論

英偉達(dá)推出高效小語(yǔ)言AI模型Mistral-NeMo-Minitron 8B

相關(guān)推薦

發(fā)表回復(fù)

分享到: