英偉達(dá)NVIDIA推出企業(yè)級(jí)生成式AI微服務(wù)，加速AI應(yīng)用部署與創(chuàng)新

科技探索者 ? 2024年3月20日 10:04:00 ? AI, 新聞

在人工智能領(lǐng)域，企業(yè)正面臨著前所未有的機(jī)遇與挑戰(zhàn)。為了滿足市場(chǎng)對(duì)于快速、高效且定制化AI應(yīng)用的需求，NVIDIA于太平洋時(shí)間2024年3月18日在其總部加利福尼亞州圣何塞，隆重推出了數(shù)十項(xiàng)企業(yè)級(jí)生成式AI微服務(wù)。這些微服務(wù)旨在為開發(fā)者提供一個(gè)強(qiáng)大的平臺(tái)，幫助他們創(chuàng)建和部署定制化的生成式AI助手，同時(shí)確保企業(yè)對(duì)知識(shí)產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。

這些生成式AI微服務(wù)是基于NVIDIA CUDA平臺(tái)開發(fā)的云原生服務(wù)目錄，其中包括NVIDIA NIM微服務(wù)，該服務(wù)能夠優(yōu)化NVIDIA及其合作伙伴生態(tài)系統(tǒng)中20多個(gè)熱門AI模型的推理性能。此外，用戶還可以以NVIDIA CUDA-X微服務(wù)的形式，利用NVIDIA加速軟件開發(fā)套件、庫和工具，進(jìn)行增強(qiáng)生成檢索（RAG）、護(hù)欄、數(shù)據(jù)處理、高性能計(jì)算（HPC）等操作。值得一提的是，NVIDIA還發(fā)布了20多項(xiàng)針對(duì)醫(yī)療領(lǐng)域的NIM和CUDA-X微服務(wù)，進(jìn)一步拓寬了AI在醫(yī)療行業(yè)的應(yīng)用前景。

這些微服務(wù)的推出，為NVIDIA的全棧計(jì)算平臺(tái)增添了新的一層。它們將模型開發(fā)人員、平臺(tái)提供商和企業(yè)緊密地連接在一起，形成了一個(gè)強(qiáng)大的AI生態(tài)系統(tǒng)。通過這個(gè)標(biāo)準(zhǔn)化的路徑，企業(yè)可以輕松地運(yùn)行針對(duì)NVIDIA CUDA安裝基礎(chǔ)（包括云、數(shù)據(jù)中心、工作站和PC中的數(shù)以億計(jì)的GPU）優(yōu)化的定制AI模型。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，企業(yè)平臺(tái)擁有大量的數(shù)據(jù)資源，這些數(shù)據(jù)可以轉(zhuǎn)化為生成式AI助手，為企業(yè)帶來巨大的商業(yè)價(jià)值。NVIDIA與合作伙伴生態(tài)系統(tǒng)共同開發(fā)的這些容器化AI微服務(wù)，將成為各行業(yè)企業(yè)成為AI公司的基石。

值得一提的是，NIM推理微服務(wù)的推出，極大地縮短了部署時(shí)間，從傳統(tǒng)的幾周縮短至幾分鐘。這些微服務(wù)提供了基于NVIDIA推理軟件的預(yù)構(gòu)建容器，包括Triton推理服務(wù)器和TensorRT-LLM，使開發(fā)者能夠快速構(gòu)建并部署AI應(yīng)用。此外，NIM微服務(wù)還為語言、語音和藥物發(fā)現(xiàn)等領(lǐng)域提供了行業(yè)標(biāo)準(zhǔn)API，讓開發(fā)者能夠利用自己基礎(chǔ)設(shè)施中的專有數(shù)據(jù)，實(shí)現(xiàn)更加安全、高效的AI應(yīng)用開發(fā)。

在實(shí)際應(yīng)用中，這些生成式AI微服務(wù)已經(jīng)得到了廣泛應(yīng)用。例如，ServiceNow宣布正在使用NIM來加快針對(duì)特定領(lǐng)域的全新助手和其他生成式AI應(yīng)用的開發(fā)和部署。此外，用戶還可以從亞馬遜SageMaker、谷歌Kubernetes Engine和微軟Azure AI等平臺(tái)訪問NIM微服務(wù)，并與Deepset、LangChain和LlamaIndex等流行的AI框架進(jìn)行集成。

除了NIM微服務(wù)外，CUDA-X微服務(wù)也為AI應(yīng)用的開發(fā)提供了強(qiáng)大的支持。這些微服務(wù)為數(shù)據(jù)準(zhǔn)備、定制和訓(xùn)練提供了端到端的構(gòu)建模塊，助力企業(yè)加速開發(fā)生產(chǎn)級(jí)AI。通過利用NVIDIA Riva進(jìn)行定制語音和翻譯AI的開發(fā)，以及使用NVIDIA cuOpt進(jìn)行路由優(yōu)化，企業(yè)可以進(jìn)一步提升AI應(yīng)用的性能和準(zhǔn)確性。此外，NeMo Retriever微服務(wù)的推出，使得開發(fā)者能夠?qū)I應(yīng)用與業(yè)務(wù)數(shù)據(jù)緊密鏈接，從而提高AI助手的準(zhǔn)確性和洞察力。

綜上所述，NVIDIA推出的企業(yè)級(jí)生成式AI微服務(wù)為企業(yè)提供了強(qiáng)大的技術(shù)支持和創(chuàng)新動(dòng)力。這些微服務(wù)不僅簡(jiǎn)化了AI應(yīng)用的開發(fā)和部署流程，還為企業(yè)帶來了更高的靈活性和性能。隨著AI技術(shù)的不斷發(fā)展，相信這些微服務(wù)將在未來發(fā)揮更加重要的作用，推動(dòng)AI應(yīng)用的普及和創(chuàng)新。

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請(qǐng)注明出處：http://2079x.cn/article/638486.html

AI NVIDIA 生成式AI微服務(wù)英偉達(dá)

科技探索者管理團(tuán)隊(duì)

0 0

新聞

昆侖萬維豪賭AI致巨虧16億，投資者買單？

4月25日，昆侖萬維（300418.SZ）交出一份令市場(chǎng)嘩然的成績(jī)單：2024年?營(yíng)業(yè)總收入56.6億元，同比增長(zhǎng)15.2%?，但歸母凈利潤(rùn)卻巨虧?15.95億元?，同比暴跌226…

聆聽
5天前
新聞

英偉達(dá)GTC大會(huì)首度登陸臺(tái)北國(guó)際電腦展，AI技術(shù)盛宴即將開幕

英偉達(dá)官網(wǎng)最新信息顯示，其年度技術(shù)盛會(huì)?GTC Taipei 2025?將于5月21日至22日在臺(tái)北漢來大飯店舉行，同期配套的實(shí)作坊活動(dòng)則從5月20日持續(xù)至22日。這是英偉達(dá)首次將…

野游栗
5天前
新聞

AI智能體公司完成7500萬美元融資，估值四個(gè)月暴漲四倍

彭博社報(bào)道稱，中國(guó)通用型AI智能體開發(fā)商蝴蝶效應(yīng)（Butterfly Effect）近期完成7500萬美元（約合5.47億元人民幣）融資，由美國(guó)頂級(jí)風(fēng)投Benchmark領(lǐng)投，現(xiàn)有…

商業(yè)頭條
2025年4月25日
新聞

?傳媒巨頭Ziff Davis起訴OpenAI：指控非法抓取數(shù)百萬文章訓(xùn)練AI

據(jù)外媒報(bào)道稱，美國(guó)數(shù)字媒體集團(tuán)Ziff Davis正式向紐約聯(lián)邦法院提起訴訟，指控人工智能公司OpenAI在未經(jīng)授權(quán)的情況下，“系統(tǒng)性復(fù)制”其旗下包括CNET、PCMag等45個(gè)媒…

小丸子
2025年4月25日
新聞

英偉達(dá)高管:AI數(shù)據(jù)中心建設(shè)熱度未減

當(dāng)?shù)貢r(shí)間4月24日，在美國(guó)哈姆能源研究院主辦的行業(yè)峰會(huì)上，英偉達(dá)、亞馬遜及AI初創(chuàng)公司高管集體發(fā)聲，強(qiáng)調(diào)全球人工智能數(shù)據(jù)中心建設(shè)仍保持高速推進(jìn)。英偉達(dá)高管:AI數(shù)據(jù)中心建設(shè)熱度未減…

李森
2025年4月25日
出海

沃爾瑪發(fā)布AI工具，顛覆服裝業(yè)

沃爾瑪正式宣布其自主研發(fā)的生成式AI工具“Trend-to-Product”全面應(yīng)用于服裝開發(fā)，該工具通過分析社交媒體、電商平臺(tái)等渠道的實(shí)時(shí)數(shù)據(jù)，將傳統(tǒng)服裝開發(fā)周期從18周縮短至6…

AI
2025年4月25日
新聞

?微軟Microsoft 365 Copilot免費(fèi)用戶5月將迎重大更新：導(dǎo)航界面全面改版

據(jù)外媒披露，微軟計(jì)劃自5月中旬起向所有Microsoft 365 Copilot Chat用戶（無需付費(fèi)訂閱許可證）推送“Wave 2春季更新”。此次升級(jí)重點(diǎn)優(yōu)化導(dǎo)航與交互邏輯，旨…

Microsoft
2025年4月24日
AI

?Gemini用戶半年激增3倍谷歌AI月活破3.5億緊追ChatGPT

根據(jù)谷歌反壟斷訴訟中最新披露的內(nèi)部數(shù)據(jù)，其人工智能聊天機(jī)器人Gemini全球月活躍用戶數(shù)（MAU）在今年3月達(dá)到3.5億，較六個(gè)月前增長(zhǎng)近3倍。這是谷歌首次公開該產(chǎn)品的用戶增長(zhǎng)軌跡…

Google
2025年4月24日
AI

OpenAI計(jì)劃開源首款A(yù)I模型推理性能對(duì)標(biāo)Meta、谷歌

近日，OpenAI正式確認(rèn)將推出自2019年GPT-2以來的首個(gè)開源語言模型。據(jù)知情人士透露，該模型由研究副總裁Aidan Clark主導(dǎo)開發(fā)，計(jì)劃于今年夏季初發(fā)布，其核心目標(biāo)是在…

AI
2025年4月24日
AI

英偉達(dá)發(fā)布Eagle 2.5視覺語言模型：8B參數(shù)單挑GPT-4o

英偉達(dá)于近日發(fā)布全新視覺語言模型Eagle 2.5，這款僅8B參數(shù)的AI在長(zhǎng)視頻理解領(lǐng)域?qū)崿F(xiàn)突破。該模型在Video-MME基準(zhǔn)測(cè)試（512幀輸入）中斬獲72.4%準(zhǔn)確率，性能直指…

AI
2025年4月23日
AI

OpenAI o3及o4-mini模型被曝植入“隱形水印”：AI生成文本暗藏特殊符號(hào)

AI初創(chuàng)公司Rumi近日發(fā)布報(bào)告稱，OpenAI最新發(fā)布的o3及o4-mini模型中，其生成的文本內(nèi)嵌入了特殊Unicode字符“窄不換行空格”（NNBSP，U+202F），疑似用…

AI
2025年4月22日
AI

?全球首個(gè)AI“法律官”上線：阿聯(lián)酋立法提速70%

阿聯(lián)酋內(nèi)閣近日批準(zhǔn)全球首個(gè)“AI立法”計(jì)劃，宣布啟用人工智能系統(tǒng)制定新法及修訂現(xiàn)有法律。據(jù)《金融時(shí)報(bào)》報(bào)道，該國(guó)將成立專門機(jī)構(gòu)“監(jiān)管智能辦公室”，構(gòu)建涵蓋聯(lián)邦法、地方法及法院判決等…

AI
2025年4月21日
AI

OpenAI o3數(shù)學(xué)大模型遭”實(shí)測(cè)打假”：測(cè)試成績(jī)被指虛高

近日，人工智能領(lǐng)域再現(xiàn)基準(zhǔn)測(cè)試爭(zhēng)議。OpenAI最新發(fā)布的o3大模型因第一方與第三方測(cè)試結(jié)果懸殊，陷入”成績(jī)注水”質(zhì)疑。第三方機(jī)構(gòu)實(shí)測(cè)顯示，該模型在權(quán)威數(shù)學(xué)…

AI
2025年4月21日
新聞

工信部談Deepseek等大模型“出圈”

在4月18日國(guó)新辦發(fā)布會(huì)上，工業(yè)和信息化部總工程師謝少鋒為國(guó)產(chǎn)大模型”點(diǎn)贊”。在介紹2025年一季度發(fā)展成果時(shí)，他特別提及以DeepSeek為代表的國(guó)產(chǎn)大模…

AI
2025年4月19日
新聞

黃仁勛受邀訪華再表態(tài) 英偉達(dá)承諾“優(yōu)化合規(guī)芯片”服務(wù)40年老客戶

4月17日晚，英偉達(dá)CEO黃仁勛應(yīng)中國(guó)貿(mào)促會(huì)邀請(qǐng)抵達(dá)北京，引發(fā)全球科技界關(guān)注。據(jù)媒體報(bào)道，英偉達(dá)官方回應(yīng)稱“公司定期與各國(guó)政府討論產(chǎn)品技術(shù)”，并確認(rèn)黃仁勛此行已與中國(guó)貿(mào)促會(huì)會(huì)長(zhǎng)任鴻…

NEWS
2025年4月18日
新聞

曝黃仁勛會(huì)見DeepSeek創(chuàng)始人梁文鋒

昨日，英偉達(dá)CEO黃仁勛現(xiàn)身北京引發(fā)全球科技界關(guān)注。據(jù)英國(guó)《金融時(shí)報(bào)》披露，此行黃仁勛會(huì)見DeepSeek創(chuàng)始人梁文鋒，雙方重點(diǎn)討論“為中國(guó)市場(chǎng)設(shè)計(jì)下一代合規(guī)芯片”的技術(shù)方案。這是…

秋秋
2025年4月18日
AI

?字節(jié)跳動(dòng)豆包1.5模型發(fā)布：看圖思考、視頻找答案全能升級(jí)

在近日的火山引擎AI創(chuàng)新巡展杭州站上，字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布豆包1.5深度思考模型。這款多模態(tài)大模型在數(shù)學(xué)推理、編程競(jìng)賽、科學(xué)分析等專業(yè)領(lǐng)域表現(xiàn)突出，其數(shù)學(xué)能力追平O…

AI
2025年4月17日
AI

?OpenAI豪擲30億美元收購(gòu)編程工具或創(chuàng)公司最大收購(gòu)紀(jì)錄

據(jù)彭博社援引知情人士消息，OpenAI正就以約30億美元（約合219.67億元人民幣）收購(gòu)人工智能編程工具Windsurf（原名Codeium）進(jìn)行談判。若交易達(dá)成，這將成為Ope…

AI
2025年4月17日
新聞

消息稱字節(jié)跳動(dòng)旗下AI Lab全員并入Seed團(tuán)隊(duì)，百萬年薪搶博士備戰(zhàn)大模型

近日，據(jù)知情人士透露，字節(jié)跳動(dòng)啟動(dòng)新一輪AI組織架構(gòu)調(diào)整，原核心AI研發(fā)部門AI Lab將全部并入大模型研發(fā)團(tuán)隊(duì)Seed。此次整合意味著字節(jié)AI資源進(jìn)一步向大模型領(lǐng)域集中，為技術(shù)攻…

好奇寶寶
2025年4月16日
出海

?阿里旗下Lazada推出“Lazzie Seller” 助商家一鍵提效

近日，阿里巴巴集團(tuán)旗下東南亞電商平臺(tái)Lazada正式推出商家專用AI助理Lazzie Seller。這款工具基于自然語言處理技術(shù)，可實(shí)時(shí)響應(yīng)商家在店鋪運(yùn)營(yíng)中的各類問題，包括功能操作…

小丸子
2025年4月16日