英偉達NVIDIA推出企業(yè)級生成式AI微服務,加速AI應用部署與創(chuàng)新

英偉達NVIDIA推出企業(yè)級生成式AI微服務,加速AI應用部署與創(chuàng)新

在人工智能領域,企業(yè)正面臨著前所未有的機遇與挑戰(zhàn)。為了滿足市場對于快速、高效且定制化AI應用的需求,NVIDIA于太平洋時間2024年3月18日在其總部加利福尼亞州圣何塞,隆重推出了數(shù)十項企業(yè)級生成式AI微服務。這些微服務旨在為開發(fā)者提供一個強大的平臺,幫助他們創(chuàng)建和部署定制化的生成式AI助手,同時確保企業(yè)對知識產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。

這些生成式AI微服務是基于NVIDIA CUDA平臺開發(fā)的云原生服務目錄,其中包括NVIDIA NIM微服務,該服務能夠優(yōu)化NVIDIA及其合作伙伴生態(tài)系統(tǒng)中20多個熱門AI模型的推理性能。此外,用戶還可以以NVIDIA CUDA-X微服務的形式,利用NVIDIA加速軟件開發(fā)套件、庫和工具,進行增強生成檢索(RAG)、護欄、數(shù)據(jù)處理、高性能計算(HPC)等操作。值得一提的是,NVIDIA還發(fā)布了20多項針對醫(yī)療領域的NIM和CUDA-X微服務,進一步拓寬了AI在醫(yī)療行業(yè)的應用前景。

這些微服務的推出,為NVIDIA的全棧計算平臺增添了新的一層。它們將模型開發(fā)人員、平臺提供商和企業(yè)緊密地連接在一起,形成了一個強大的AI生態(tài)系統(tǒng)。通過這個標準化的路徑,企業(yè)可以輕松地運行針對NVIDIA CUDA安裝基礎(包括云、數(shù)據(jù)中心、工作站和PC中的數(shù)以億計的GPU)優(yōu)化的定制AI模型。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,企業(yè)平臺擁有大量的數(shù)據(jù)資源,這些數(shù)據(jù)可以轉(zhuǎn)化為生成式AI助手,為企業(yè)帶來巨大的商業(yè)價值。NVIDIA與合作伙伴生態(tài)系統(tǒng)共同開發(fā)的這些容器化AI微服務,將成為各行業(yè)企業(yè)成為AI公司的基石。

值得一提的是,NIM推理微服務的推出,極大地縮短了部署時間,從傳統(tǒng)的幾周縮短至幾分鐘。這些微服務提供了基于NVIDIA推理軟件的預構(gòu)建容器,包括Triton推理服務器和TensorRT-LLM,使開發(fā)者能夠快速構(gòu)建并部署AI應用。此外,NIM微服務還為語言、語音和藥物發(fā)現(xiàn)等領域提供了行業(yè)標準API,讓開發(fā)者能夠利用自己基礎設施中的專有數(shù)據(jù),實現(xiàn)更加安全、高效的AI應用開發(fā)。

在實際應用中,這些生成式AI微服務已經(jīng)得到了廣泛應用。例如,ServiceNow宣布正在使用NIM來加快針對特定領域的全新助手和其他生成式AI應用的開發(fā)和部署。此外,用戶還可以從亞馬遜SageMaker、谷歌Kubernetes Engine和微軟Azure AI等平臺訪問NIM微服務,并與Deepset、LangChain和LlamaIndex等流行的AI框架進行集成。

除了NIM微服務外,CUDA-X微服務也為AI應用的開發(fā)提供了強大的支持。這些微服務為數(shù)據(jù)準備、定制和訓練提供了端到端的構(gòu)建模塊,助力企業(yè)加速開發(fā)生產(chǎn)級AI。通過利用NVIDIA Riva進行定制語音和翻譯AI的開發(fā),以及使用NVIDIA cuOpt進行路由優(yōu)化,企業(yè)可以進一步提升AI應用的性能和準確性。此外,NeMo Retriever微服務的推出,使得開發(fā)者能夠?qū)I應用與業(yè)務數(shù)據(jù)緊密鏈接,從而提高AI助手的準確性和洞察力。

綜上所述,NVIDIA推出的企業(yè)級生成式AI微服務為企業(yè)提供了強大的技術支持和創(chuàng)新動力。這些微服務不僅簡化了AI應用的開發(fā)和部署流程,還為企業(yè)帶來了更高的靈活性和性能。隨著AI技術的不斷發(fā)展,相信這些微服務將在未來發(fā)揮更加重要的作用,推動AI應用的普及和創(chuàng)新。

原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/638486.html

科技探索者的頭像科技探索者管理團隊

相關推薦

發(fā)表回復

登錄后才能評論