英偉達(dá)開源Nemotron-70B模型，性能超越GPT-4o和Claude 3.5

AI ? 2024年10月18日 11:49:00 ? AI

近日，英偉達(dá)悄然開源了其最新的超強(qiáng)大模型——Nemotron-70B。一經(jīng)發(fā)布，該模型便迅速在AI社區(qū)引發(fā)轟動，其性能在多個基準(zhǔn)測試中超越了包括GPT-4、GPT-4 Turbo以及Claude 3.5 Sonnet在內(nèi)的140多個開閉源模型，僅次于OpenAI的最新模型o1。

Nemotron-70B的基礎(chǔ)模型是基于Llama-3.1-70B開發(fā)而成，并通過人類反饋強(qiáng)化學(xué)習(xí)進(jìn)行了訓(xùn)練，特別是采用了“強(qiáng)化算法”。在訓(xùn)練過程中，英偉達(dá)使用了一種新的混合訓(xùn)練方法，包括Bradley-Terry和Regression在內(nèi)的訓(xùn)練獎勵模型，同時(shí)開源了訓(xùn)練數(shù)據(jù)集。該模型基于Llama-3.1-Nemotron-70B-Reward提供獎勵信號，并利用HelpSteer2-Preference提示來引導(dǎo)模型生成符合人類偏好的答案。

在LMSYS大模型競技場中的Arena Hard評測中，Nemotron-70B得分85，在AlpacaEval 2 LC上得分57.6，在GPT-4-Turbo MT-Bench上為8.98。這些成績充分展示了其強(qiáng)大的性能。

網(wǎng)友們紛紛對Nemotron-70B進(jìn)行了測試，發(fā)現(xiàn)該模型在處理復(fù)雜問題時(shí)表現(xiàn)出色。例如，在回答關(guān)于香蕉數(shù)量的問題時(shí)，Nemotron-70B能夠準(zhǔn)確地將問題所給信息進(jìn)行分解，并一步一步推理得出正確答案。此外，在回答關(guān)于活到89歲的名人名單時(shí)，盡管模型將某人的去世日期弄錯，但整體表現(xiàn)仍然令人印象深刻。

值得注意的是，Nemotron-70B在hard prompt上的表現(xiàn)也備受關(guān)注。雖然在一些測試中未能完全通過，但其給出的初步輸出非常有趣且富有啟發(fā)性。例如，在回答關(guān)于月球距離和步行到月球的合理性的問題時(shí)，Nemotron-70B從物理學(xué)的角度進(jìn)行了詳細(xì)分析，并得出了合理的結(jié)論。

業(yè)內(nèi)專家表示，英偉達(dá)之所以不斷開源超強(qiáng)模型，是為了推動芯片銷售。隨著模型變得越來越復(fù)雜，所有盈利公司都必須訂購更多芯片來訓(xùn)練這些模型。因此，開源模型實(shí)際上是在為硬件銷售鋪路。

然而，對于大模型初創(chuàng)企業(yè)來說，巨頭們的開源策略無疑帶來了巨大的壓力。這些企業(yè)往往難以在商業(yè)落地和名氣上與巨頭們競爭，如果無法創(chuàng)造利潤，將很快失去風(fēng)投的資助，面臨倒閉的風(fēng)險(xiǎn)。

盡管如此，Nemotron-70B的開源仍然為AI社區(qū)帶來了巨大的價(jià)值。該模型的出現(xiàn)不僅推動了AI技術(shù)的發(fā)展，還為研究人員和開發(fā)人員提供了更多的選擇和可能性。

英偉達(dá)開源Nemotron-70B模型無疑為AI領(lǐng)域帶來了新的活力和機(jī)遇。我們期待未來能夠看到更多優(yōu)秀的開源模型出現(xiàn)，共同推動AI技術(shù)的發(fā)展和進(jìn)步。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/686939.html

AI認(rèn)證作者

0 0

AI

GPT-4謝幕倒計(jì)時(shí)：OpenAI全面啟用多模態(tài)GPT-4o

OpenAI于昨日正式宣布，ChatGPT平臺將于本月30日停止支持GPT-4模型，全面切換至新一代原生多模態(tài)模型GPT-4o。目前官網(wǎng)GPT-4頁面已新增”4月30日…

AI
3天前
商業(yè)

科技七姐妹遭“黑色48小時(shí)”：蘋果單日市值蒸發(fā)4159億美元

近日，美股經(jīng)歷劇烈震蕩，被稱為“七姐妹”的科技巨頭蘋果、英偉達(dá)、Meta、谷歌、微軟、亞馬遜、特斯拉在4月4日至5日兩個交易日內(nèi)市值蒸發(fā)1.5萬億美元。這場風(fēng)暴導(dǎo)致納斯達(dá)克綜合指數(shù)…

商業(yè)頭條
2025年4月7日
AI

ChatGPT Plus向美加大學(xué)生提供免費(fèi)服務(wù)，至5月31日

OpenAI首席執(zhí)行官山姆·阿爾特曼于4月4日通過社交平臺X宣布，即日起至5月31日，加拿大及美國在校大學(xué)生可免費(fèi)使用ChatGPT Plus服務(wù)。這一教育專項(xiàng)計(jì)劃覆蓋兩國逾300…

AI
2025年4月5日
新聞

螞蟻集團(tuán)AI訓(xùn)練大突破：國產(chǎn)芯片替代英偉達(dá)，成本直降20%

據(jù)彭博社援引知情人士消息，螞蟻集團(tuán)正通過中國自主研發(fā)的芯片開發(fā)AI模型訓(xùn)練技術(shù)，成功將成本壓縮20%。其訓(xùn)練效果已與英偉達(dá)H800芯片相當(dāng)，標(biāo)志著國產(chǎn)芯片在高端AI領(lǐng)域的重大突破。…

AI
2025年3月24日
產(chǎn)品

英偉達(dá)RTX 5060 Ti雙顯存版官宣：4月16日同步上市

北京時(shí)間3月22日，X平臺知名科技爆料人Алексей (@wxnod) 發(fā)布最新消息稱，英偉達(dá)已確定于?4月16日?正式發(fā)布GeForce RTX 5060 Ti桌面端顯卡，且?…

AI
2025年3月24日
商業(yè)

英偉達(dá)重金收購AI數(shù)據(jù)公司Gretel，生成式模型訓(xùn)練添“彈藥庫”

據(jù)外媒報(bào)道，全球AI芯片巨頭英偉達(dá)（Nvidia）近日完成對合成數(shù)據(jù)企業(yè)Gretel的收購。據(jù)《連線》雜志報(bào)道，本次交易金額達(dá)九位數(shù)美元，超過Gretel最新3.2億美元（約23.…

商業(yè)頭條
2025年3月21日
AI

DeepMind資深科學(xué)家離職創(chuàng)辦機(jī)器人公司Generalist AI，獲NVentures投資

谷歌DeepMind前機(jī)器人科學(xué)家Pete Florence近日宣布創(chuàng)立AI機(jī)器人公司Generalist AI，并已獲得英偉達(dá)旗下風(fēng)投機(jī)構(gòu)NVentures的戰(zhàn)略投資。這家初創(chuàng)公…

AI
2025年3月20日
AI

GTC 2025大會：機(jī)器人Blue亮相

在英偉達(dá)GTC 2025大會上，機(jī)器人Blue亮相。據(jù)了解，英偉達(dá)CEO黃仁勛在GTC 2025大會壓軸環(huán)節(jié)放出“大招”——聯(lián)合谷歌DeepMind、迪士尼共同發(fā)布名為Newton…

AI
2025年3月20日
產(chǎn)品

英偉達(dá)Nvidia宣布推出Blackwell Ultra和Rubin AI芯片

昨日，英偉達(dá)NVIDIA首席執(zhí)行官黃仁勛在年度GTC技術(shù)大會上宣布多項(xiàng)重磅產(chǎn)品規(guī)劃：Blackwell Ultra芯片系列將于今年下半年面世，下一代圖形處理器Vera Rubin預(yù)…

AI
2025年3月20日
新聞

黃仁勛再談DeepSeek：新型AI對算力的渴求只會更強(qiáng)

在英偉達(dá)年度技術(shù)盛會GTC 2025大會上，黃仁勛再談DeepSeek。公司創(chuàng)始人兼CEO黃仁勛在主題演講中直面行業(yè)爭議，針對近期科技圈熱議的”DeekSeek公司R1…

野游栗
2025年3月20日
AI

英偉達(dá)發(fā)布基于DeepSeek-R1 AI推理系統(tǒng) 創(chuàng)全球性能新紀(jì)錄

在3月19日舉行的NVIDIA GTC 2025技術(shù)大會上，英偉達(dá)正式推出基于DeepSeek-R1大模型的AI推理系統(tǒng)。官方披露，搭載八塊Blackwell架構(gòu)GPU的NVIDI…

AI
2025年3月19日
商業(yè)

英偉達(dá)GTC大會今日開幕！黃仁勛將發(fā)布新一代AI芯片，股價(jià)波動引關(guān)注

今日，英偉達(dá)（NVDA）年度GTC技術(shù)大會正式召開。此前一個交易日（3月17日），英偉達(dá)股價(jià)下跌1.8%，收于119.51美元，亞馬遜、Meta等科技股同步走低。不過，該公司股價(jià)上…

李小白
2025年3月18日
新聞

鴻海宣布英偉達(dá)GB200 AI服務(wù)器量產(chǎn)達(dá)標(biāo) 下半年啟動全球交付

鴻海精密工業(yè)股份有限公司董事長劉揚(yáng)偉在3月14日舉行的法人說明會上正式宣布，英偉達(dá)GB200人工智能服務(wù)器已通過量產(chǎn)驗(yàn)證，首批產(chǎn)品將于今年第三季度向客戶交付。他表示，經(jīng)過對全球12…

小科同學(xué)
2025年3月15日
AI

?英偉達(dá)官宣新一代AI芯片Rubin：以暗物質(zhì)先驅(qū)女科學(xué)家命名

據(jù)CNBC報(bào)道，英偉達(dá)CEO黃仁勛將于?3月19日GTC大會?正式發(fā)布新一代AI芯片平臺“Rubin”，其命名源自暗物質(zhì)研究先驅(qū)、美國天文學(xué)家薇拉·魯賓（Vera Rubin）。這…

AI
2025年3月14日
新聞

臺積電聯(lián)手英偉達(dá)/AMD洽購英特爾代工業(yè)務(wù)，后者股價(jià)暴漲超10%

據(jù)路透社援引知情人士消息稱，臺積電正聯(lián)合英偉達(dá)、AMD、博通等芯片巨頭，就組建合資公司接管英特爾晶圓代工部門展開談判。受此消息刺激，英特爾美股夜盤短線飆升超10%，創(chuàng)近三個月最大單…

小丸子
2025年3月12日
新聞

臺積電2月份營收79億美元同比繼續(xù)大增但環(huán)比有下滑

臺積電2月份營收大增43.1%，環(huán)比下滑11.3%，同比增長率超過30%，前兩個月營收5532.97億新臺幣，高于去年同期的3974.33億。

秋秋
2025年3月10日
產(chǎn)品

?英偉達(dá)RTX 5060 Ti/5050顯卡參數(shù)全曝光：4月上市在即

今日，知名爆料人@kopite7kimi在X平臺發(fā)布英偉達(dá)GeForce RTX 5060 Ti與RTX 5050顯卡完整參數(shù)，確認(rèn)兩款產(chǎn)品將基于全新“Blackwell”架構(gòu)的G…

AI
2025年3月10日
產(chǎn)品

?英偉達(dá)回應(yīng)RTX 50移動顯卡ROP爭議：否認(rèn)缺陷，強(qiáng)調(diào)標(biāo)準(zhǔn)檢測流程

據(jù)德國媒體Heise Online報(bào)道稱，英偉達(dá)RTX 50系列筆記本GPU疑似存在與桌面版相同的ROP（光柵處理單元）缺失問題，可能導(dǎo)致光柵化性能下降。消息稱，英偉達(dá)已要求遠(yuǎn)東地…

happy
2025年3月7日
產(chǎn)品

英偉達(dá)RTX 5070非公版今晚全球上市，性能實(shí)測不及預(yù)期

今日，英偉達(dá) GeForce RTX 5070 顯卡正式解禁，并計(jì)劃于當(dāng)晚 22:00全球上市。但官方確認(rèn)，原定的 RTX 5070 FE 創(chuàng)始人版（公版）將推遲至 3 月下旬發(fā)售…

野游栗
2025年3月5日
商業(yè)

英偉達(dá)市值一夜蒸發(fā)近2萬億元

美東時(shí)間2月26日周三盤后，英偉達(dá)發(fā)布2025財(cái)年（對應(yīng)自然年2024年）第四財(cái)季及全年財(cái)報(bào)。數(shù)據(jù)顯示，第四財(cái)季營收達(dá)393.31億美元，同比大增78%，遠(yuǎn)超市場預(yù)期的380.5億…

野游栗
2025年3月4日