英偉達發(fā)布Llama-3.1-Nemotron-51B AI模型：單H100 GPU實現(xiàn)高效運算新突破

AI ? 2024年9月25日 17:15:00 ? AI

近日，英偉達公司宣布了一項重大技術(shù)創(chuàng)新，成功推出了基于Meta公司Llama-3.1-70B模型的優(yōu)化版本——Llama-3.1-Nemotron-51B AI模型。這款新型AI模型通過創(chuàng)新的神經(jīng)架構(gòu)搜索（NAS）技術(shù)，實現(xiàn)了在保持高精度的同時，顯著提升運算效率，使得單片H100 GPU即可處理以往需要更高硬件資源的大型任務(wù)。

Llama-3.1-Nemotron-51B模型繼承了Llama-3.1-70B的強大功能，但參數(shù)規(guī)?？s減至510億，通過精細的NAS技術(shù)微調(diào)，不僅減少了內(nèi)存消耗和計算復雜性，還顯著降低了運行成本。英偉達表示，這一優(yōu)化使得新模型在推理速度上比原70B版本提升了2.2倍，展現(xiàn)出極高的能效比。

在多個基準測試中，Llama-3.1-Nemotron-51B展現(xiàn)了令人矚目的表現(xiàn)。在MT Bench、MMLU、文本生成及摘要等任務(wù)上，該模型均保持了接近原版的準確率，同時顯著提升了處理速度。特別是在單個H100 GPU上的表現(xiàn)，更是令人印象深刻，能夠管理比以往更大的工作負載，實現(xiàn)了4倍以上的性能提升。

這一成就得益于英偉達在架構(gòu)優(yōu)化上的深入探索。團隊采用了分塊蒸餾和知識蒸餾技術(shù)，通過訓練更小的學生模型來模仿大型教師模型的功能，從而在保持精度的同時大幅降低資源需求。此外，Puzzle算法的應(yīng)用也為模型架構(gòu)的優(yōu)化提供了有力支持，通過對不同區(qū)塊的評分和配置優(yōu)化，實現(xiàn)了速度與精度的最佳平衡。

英偉達表示，Llama-3.1-Nemotron-51B的成功推出，不僅為AI領(lǐng)域帶來了新的技術(shù)突破，也為實際應(yīng)用場景提供了更為高效、經(jīng)濟的解決方案。隨著AI技術(shù)的不斷發(fā)展，如何在保持精度的同時提高運算效率，成為了行業(yè)關(guān)注的焦點。英偉達此次的創(chuàng)新嘗試，無疑為這一問題的解決提供了新的思路和方向。

展望未來，英偉達將繼續(xù)致力于AI技術(shù)的研發(fā)和創(chuàng)新，推動AI技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。Llama-3.1-Nemotron-51B模型的發(fā)布，無疑是英偉達在這一道路上邁出的堅實一步。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/682780.html

AI認證作者

0 0

新聞

?Meta重啟歐盟用戶數(shù)據(jù)訓練AI 用戶可自主選擇退出

Meta公司本周一宣布，將恢復在歐盟地區(qū)使用Facebook和Instagram的公開內(nèi)容（如帖子、評論）訓練其人工智能模型。此前因數(shù)據(jù)隱私爭議，該計劃曾被暫停近半年。Meta表示…

NEWS
7小時前
新聞

谷歌安卓和 Pixel 手機團隊被曝裁員數(shù)百人

4 月 14 日，據(jù)報道，一位了解情況的人士透露，Alphabet 旗下的谷歌在其平臺和設(shè)備部門裁員數(shù)百人。報道稱，該部門的裁員，發(fā)生在谷歌 1 月份向該部門員工發(fā)出要約之后。一…

潮玩君
1天前
新聞

Meta 上線 Facebook 青少年賬戶 16 歲以下用戶開直播需父母同意

在全球范圍內(nèi)對社交媒體平臺未成年人保護措施日益關(guān)注的背景下，Meta公司于4月9日宣布了一項重要舉措——將其”青少年賬戶”功能從Instagram擴展至Fa…

潮玩君
6天前
商業(yè)

科技七姐妹遭“黑色48小時”：蘋果單日市值蒸發(fā)4159億美元

近日，美股經(jīng)歷劇烈震蕩，被稱為“七姐妹”的科技巨頭蘋果、英偉達、Meta、谷歌、微軟、亞馬遜、特斯拉在4月4日至5日兩個交易日內(nèi)市值蒸發(fā)1.5萬億美元。這場風暴導致納斯達克綜合指數(shù)…

商業(yè)頭條
2025年4月7日
AI

Meta周日發(fā)布Llama 4，最強開源模型組隊殺入AI戰(zhàn)場

當?shù)貢r間4月6日，Meta在硅谷周末的平靜中突然投下AI核彈。這家科技巨頭在官網(wǎng)及開發(fā)者社區(qū)同步上線Llama 4系列，包含Scout、Maverick兩款即時可用模型，以及預告中…

AI
2025年4月7日
AI

Meta發(fā)布Llama 4系列AI模型，包含三款

近日，科技領(lǐng)域迎來新動態(tài)，Meta正式發(fā)布旗下最新Llama 4系列AI模型，包含Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款…

AI
2025年4月6日
商業(yè)

美股集體收漲特斯拉漲近12%

美東時間3月24日，美國股市迎來強勢開局，三大基準指數(shù)集體收漲。道瓊斯工業(yè)平均指數(shù)勁升597.97點（+1.42%）至42583.32點，納斯達克綜合指數(shù)暴漲404.54點（+2.…

商業(yè)頭條
2025年3月25日
新聞

螞蟻集團AI訓練大突破：國產(chǎn)芯片替代英偉達，成本直降20%

據(jù)彭博社援引知情人士消息，螞蟻集團正通過中國自主研發(fā)的芯片開發(fā)AI模型訓練技術(shù)，成功將成本壓縮20%。其訓練效果已與英偉達H800芯片相當，標志著國產(chǎn)芯片在高端AI領(lǐng)域的重大突破?！?/p>

AI
2025年3月24日
產(chǎn)品

英偉達RTX 5060 Ti雙顯存版官宣：4月16日同步上市

北京時間3月22日，X平臺知名科技爆料人Алексей (@wxnod) 發(fā)布最新消息稱，英偉達已確定于?4月16日?正式發(fā)布GeForce RTX 5060 Ti桌面端顯卡，且?…

AI
2025年3月24日
商業(yè)

英偉達重金收購AI數(shù)據(jù)公司Gretel，生成式模型訓練添“彈藥庫”

據(jù)外媒報道，全球AI芯片巨頭英偉達（Nvidia）近日完成對合成數(shù)據(jù)企業(yè)Gretel的收購。據(jù)《連線》雜志報道，本次交易金額達九位數(shù)美元，超過Gretel最新3.2億美元（約23.…

商業(yè)頭條
2025年3月21日
新聞

馬斯克旗下X平臺起訴印度政府，特斯拉入印談判陷微妙時刻

全球首富埃隆·馬斯克旗下社交媒體平臺X（原Twitter）與印度政府的沖突正式升級。據(jù)彭博社報道，X公司近日向印度卡納塔克邦高等法院提起訴訟，指控印度聯(lián)邦政府頻繁下達“武斷且反復無…

李小白
2025年3月21日
AI

DeepMind資深科學家離職創(chuàng)辦機器人公司Generalist AI，獲NVentures投資

谷歌DeepMind前機器人科學家Pete Florence近日宣布創(chuàng)立AI機器人公司Generalist AI，并已獲得英偉達旗下風投機構(gòu)NVentures的戰(zhàn)略投資。這家初創(chuàng)公…

AI
2025年3月20日
AI

GTC 2025大會：機器人Blue亮相

在英偉達GTC 2025大會上，機器人Blue亮相。據(jù)了解，英偉達CEO黃仁勛在GTC 2025大會壓軸環(huán)節(jié)放出“大招”——聯(lián)合谷歌DeepMind、迪士尼共同發(fā)布名為Newton…

AI
2025年3月20日
產(chǎn)品

英偉達Nvidia宣布推出Blackwell Ultra和Rubin AI芯片

昨日，英偉達NVIDIA首席執(zhí)行官黃仁勛在年度GTC技術(shù)大會上宣布多項重磅產(chǎn)品規(guī)劃：Blackwell Ultra芯片系列將于今年下半年面世，下一代圖形處理器Vera Rubin預…

AI
2025年3月20日
新聞

黃仁勛再談DeepSeek：新型AI對算力的渴求只會更強

在英偉達年度技術(shù)盛會GTC 2025大會上，黃仁勛再談DeepSeek。公司創(chuàng)始人兼CEO黃仁勛在主題演講中直面行業(yè)爭議，針對近期科技圈熱議的”DeekSeek公司R1…

野游栗
2025年3月20日
AI

英偉達發(fā)布基于DeepSeek-R1 AI推理系統(tǒng) 創(chuàng)全球性能新紀錄

在3月19日舉行的NVIDIA GTC 2025技術(shù)大會上，英偉達正式推出基于DeepSeek-R1大模型的AI推理系統(tǒng)。官方披露，搭載八塊Blackwell架構(gòu)GPU的NVIDI…

AI
2025年3月19日
商業(yè)

英偉達GTC大會今日開幕！黃仁勛將發(fā)布新一代AI芯片，股價波動引關(guān)注

今日，英偉達（NVDA）年度GTC技術(shù)大會正式召開。此前一個交易日（3月17日），英偉達股價下跌1.8%，收于119.51美元，亞馬遜、Meta等科技股同步走低。不過，該公司股價上…

李小白
2025年3月18日
新聞

鴻海宣布英偉達GB200 AI服務(wù)器量產(chǎn)達標下半年啟動全球交付

鴻海精密工業(yè)股份有限公司董事長劉揚偉在3月14日舉行的法人說明會上正式宣布，英偉達GB200人工智能服務(wù)器已通過量產(chǎn)驗證，首批產(chǎn)品將于今年第三季度向客戶交付。他表示，經(jīng)過對全球12…

小科同學
2025年3月15日
AI

?英偉達官宣新一代AI芯片Rubin：以暗物質(zhì)先驅(qū)女科學家命名

據(jù)CNBC報道，英偉達CEO黃仁勛將于?3月19日GTC大會?正式發(fā)布新一代AI芯片平臺“Rubin”，其命名源自暗物質(zhì)研究先驅(qū)、美國天文學家薇拉·魯賓（Vera Rubin）。這…

AI
2025年3月14日
新聞

臺積電聯(lián)手英偉達/AMD洽購英特爾代工業(yè)務(wù)，后者股價暴漲超10%

據(jù)路透社援引知情人士消息稱，臺積電正聯(lián)合英偉達、AMD、博通等芯片巨頭，就組建合資公司接管英特爾晶圓代工部門展開談判。受此消息刺激，英特爾美股夜盤短線飆升超10%，創(chuàng)近三個月最大單…

小丸子
2025年3月12日

發(fā)表回復

登錄后才能評論

英偉達發(fā)布Llama-3.1-Nemotron-51B AI模型：單H100 GPU實現(xiàn)高效運算新突破

相關(guān)推薦

發(fā)表回復

分享到: