英偉達(dá)NVIDIA推出企業(yè)級(jí)生成式AI微服務(wù),加速AI應(yīng)用部署與創(chuàng)新

英偉達(dá)NVIDIA推出企業(yè)級(jí)生成式AI微服務(wù),加速AI應(yīng)用部署與創(chuàng)新

在人工智能領(lǐng)域,企業(yè)正面臨著前所未有的機(jī)遇與挑戰(zhàn)。為了滿足市場(chǎng)對(duì)于快速、高效且定制化AI應(yīng)用的需求,NVIDIA于太平洋時(shí)間2024年3月18日在其總部加利福尼亞州圣何塞,隆重推出了數(shù)十項(xiàng)企業(yè)級(jí)生成式AI微服務(wù)。這些微服務(wù)旨在為開(kāi)發(fā)者提供一個(gè)強(qiáng)大的平臺(tái),幫助他們創(chuàng)建和部署定制化的生成式AI助手,同時(shí)確保企業(yè)對(duì)知識(shí)產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。

這些生成式AI微服務(wù)是基于NVIDIA CUDA平臺(tái)開(kāi)發(fā)的云原生服務(wù)目錄,其中包括NVIDIA NIM微服務(wù),該服務(wù)能夠優(yōu)化NVIDIA及其合作伙伴生態(tài)系統(tǒng)中20多個(gè)熱門AI模型的推理性能。此外,用戶還可以以NVIDIA CUDA-X微服務(wù)的形式,利用NVIDIA加速軟件開(kāi)發(fā)套件、庫(kù)和工具,進(jìn)行增強(qiáng)生成檢索(RAG)、護(hù)欄、數(shù)據(jù)處理、高性能計(jì)算(HPC)等操作。值得一提的是,NVIDIA還發(fā)布了20多項(xiàng)針對(duì)醫(yī)療領(lǐng)域的NIM和CUDA-X微服務(wù),進(jìn)一步拓寬了AI在醫(yī)療行業(yè)的應(yīng)用前景。

這些微服務(wù)的推出,為NVIDIA的全棧計(jì)算平臺(tái)增添了新的一層。它們將模型開(kāi)發(fā)人員、平臺(tái)提供商和企業(yè)緊密地連接在一起,形成了一個(gè)強(qiáng)大的AI生態(tài)系統(tǒng)。通過(guò)這個(gè)標(biāo)準(zhǔn)化的路徑,企業(yè)可以輕松地運(yùn)行針對(duì)NVIDIA CUDA安裝基礎(chǔ)(包括云、數(shù)據(jù)中心、工作站和PC中的數(shù)以億計(jì)的GPU)優(yōu)化的定制AI模型。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,企業(yè)平臺(tái)擁有大量的數(shù)據(jù)資源,這些數(shù)據(jù)可以轉(zhuǎn)化為生成式AI助手,為企業(yè)帶來(lái)巨大的商業(yè)價(jià)值。NVIDIA與合作伙伴生態(tài)系統(tǒng)共同開(kāi)發(fā)的這些容器化AI微服務(wù),將成為各行業(yè)企業(yè)成為AI公司的基石。

值得一提的是,NIM推理微服務(wù)的推出,極大地縮短了部署時(shí)間,從傳統(tǒng)的幾周縮短至幾分鐘。這些微服務(wù)提供了基于NVIDIA推理軟件的預(yù)構(gòu)建容器,包括Triton推理服務(wù)器和TensorRT-LLM,使開(kāi)發(fā)者能夠快速構(gòu)建并部署AI應(yīng)用。此外,NIM微服務(wù)還為語(yǔ)言、語(yǔ)音和藥物發(fā)現(xiàn)等領(lǐng)域提供了行業(yè)標(biāo)準(zhǔn)API,讓開(kāi)發(fā)者能夠利用自己基礎(chǔ)設(shè)施中的專有數(shù)據(jù),實(shí)現(xiàn)更加安全、高效的AI應(yīng)用開(kāi)發(fā)。

在實(shí)際應(yīng)用中,這些生成式AI微服務(wù)已經(jīng)得到了廣泛應(yīng)用。例如,ServiceNow宣布正在使用NIM來(lái)加快針對(duì)特定領(lǐng)域的全新助手和其他生成式AI應(yīng)用的開(kāi)發(fā)和部署。此外,用戶還可以從亞馬遜SageMaker、谷歌Kubernetes Engine和微軟Azure AI等平臺(tái)訪問(wèn)NIM微服務(wù),并與Deepset、LangChain和LlamaIndex等流行的AI框架進(jìn)行集成。

除了NIM微服務(wù)外,CUDA-X微服務(wù)也為AI應(yīng)用的開(kāi)發(fā)提供了強(qiáng)大的支持。這些微服務(wù)為數(shù)據(jù)準(zhǔn)備、定制和訓(xùn)練提供了端到端的構(gòu)建模塊,助力企業(yè)加速開(kāi)發(fā)生產(chǎn)級(jí)AI。通過(guò)利用NVIDIA Riva進(jìn)行定制語(yǔ)音和翻譯AI的開(kāi)發(fā),以及使用NVIDIA cuOpt進(jìn)行路由優(yōu)化,企業(yè)可以進(jìn)一步提升AI應(yīng)用的性能和準(zhǔn)確性。此外,NeMo Retriever微服務(wù)的推出,使得開(kāi)發(fā)者能夠?qū)I應(yīng)用與業(yè)務(wù)數(shù)據(jù)緊密鏈接,從而提高AI助手的準(zhǔn)確性和洞察力。

綜上所述,NVIDIA推出的企業(yè)級(jí)生成式AI微服務(wù)為企業(yè)提供了強(qiáng)大的技術(shù)支持和創(chuàng)新動(dòng)力。這些微服務(wù)不僅簡(jiǎn)化了AI應(yīng)用的開(kāi)發(fā)和部署流程,還為企業(yè)帶來(lái)了更高的靈活性和性能。隨著AI技術(shù)的不斷發(fā)展,相信這些微服務(wù)將在未來(lái)發(fā)揮更加重要的作用,推動(dòng)AI應(yīng)用的普及和創(chuàng)新。

原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/638486.html

科技探索者的頭像科技探索者管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論