華為云發(fā)布EMS彈性內(nèi)存存儲服務(wù) 打破大模型訓(xùn)練瓶頸

陳晨 ? 2024年6月22日 12:33:13 ? 產(chǎn)經(jīng)

在華為開發(fā)者大會(HDC 2024)上,華為云CTO張宇昕正式發(fā)布了EMS彈性內(nèi)存存儲服務(wù)。這一服務(wù)主要為了解決當(dāng)前大模型訓(xùn)練與推理領(lǐng)域所面臨的“內(nèi)存墻”挑戰(zhàn),即單個神經(jīng)處理單元(NPU)的高帶寬內(nèi)存(HBM)容量限制,該問題長期制約著AI算力的高效利用。

華為云EMS的創(chuàng)新之處在于它在NPU卡與持久化存儲之間增設(shè)了一層彈性內(nèi)存存儲,運用Memory Pooling專利技術(shù),綜合顯存擴展、算力卸載和以存代算三大策略,有效打破了內(nèi)存瓶頸。具體來說:

顯存擴展:大模型推理中,由于模型太大,通常需要使用大量的NPU卡才能將模型參數(shù)裝下來進行推理,但是NPU的算力往往利用率不高。EMS將模型參數(shù)分層存儲在顯存和EMS,只用了一半的卡,就可存下萬億參數(shù)的大模型,NPU部署數(shù)量減少50%。

算力卸載:大模型推理過程中包括模型計算和KV相關(guān)計算,其中KV相關(guān)計算的顯存占用很大。EMS將KV相關(guān)計算的步驟卸載到EMS,而模型計算仍在NPU中進行,將AI推理性能提升了100%。

以存代算:大模型推理中為了節(jié)省顯存,歷史對話的KV Cache都不會保存,后續(xù)推理都只能重新計算,導(dǎo)致新推理的首Token時延超過1秒?，F(xiàn)在可以將歷史KV Cache保存在EMS里,供后續(xù)推理直接調(diào)用。優(yōu)化后推理首Token時延降低到0.2秒以內(nèi),優(yōu)化了80%。

目前,EMS彈性內(nèi)存存儲服務(wù)已在華為云官網(wǎng)上線,面向開發(fā)者與客戶開放。

本文轉(zhuǎn)載自：，不代表科技訊之立場。原文鏈接：http://news.cnmtpt.com/?Sid=9919261_3163W825275046

陳晨管理團隊

0 0

產(chǎn)經(jīng)

如CGI一般的分子動力學(xué)，讓科學(xué)家看到了3D渲染后的分子運動「影片」

唯物論有句經(jīng)典名言：世界是物質(zhì)的，物質(zhì)是運動的，運動是有規(guī)律的。這不僅是在描述人類所生活其中的宏觀世界，也道出了微觀世界的本質(zhì)。得益于理論發(fā)展、實驗和計算技術(shù)的飛躍，人們對種種宏觀…

陳晨
8分鐘前
產(chǎn)經(jīng)

全面進入大屏?xí)r代，三星電視雙十一家電購物狂歡進行中

隨著消費者對于觀影娛樂體驗的要求愈發(fā)提升，大屏電視成為潮流趨勢。據(jù)奧維云網(wǎng)（AVC）數(shù)據(jù)顯示，2024年上半年，中國電視市場75英寸的產(chǎn)品零售量份額躍居第一。雙十一購物節(jié)正在火熱進…

陳晨
9分鐘前
產(chǎn)經(jīng)

HUAWEI ADS 3.0、HarmonyOS 4鴻蒙座艙上車！

在新能源汽車日新月異的當(dāng)下，智能化體驗的延續(xù)是產(chǎn)品。作為鴻蒙智行重磅車型，以及年交付超過20萬輛的國民SUV，截止10月20日，問界新M7今年累計銷量達(dá)到16.45萬。而隨著近期的…

陳晨
11分鐘前
產(chǎn)經(jīng)

HarmonyOS NEXT華為音樂煥新升級，打造高品質(zhì)沉浸式“音樂廳”

10月22日，“原生鴻蒙之夜暨華為全場景新品發(fā)布會”在深圳舉行，華為正式為用戶帶來全新的原生鴻蒙操作系統(tǒng)（HarmonyOS NEXT）。這是HarmonyOS誕生以來的重大升級，…

陳晨
1小時前
產(chǎn)經(jīng)

8條騎行拍攝Tips，賊出片！

周末在上海滴水湖邊追著日落騎行好舒服啊強烈推薦日落時分來騎行，真的能拍出人生照片！剛好今天來分享下一些騎行拍攝tips: 01追焦慢門，捕捉動感找到一條安全的馬路，攝影師可以站…

陳晨
17小時前
產(chǎn)經(jīng)

小明Q3 Pro與當(dāng)貝Smart1投影儀測評對比：千元投影的極致性價比

對于初次接觸投影儀的消費者來說,千元級別的產(chǎn)品無疑是既實惠又實用的選擇。在這個價位段中,小明Q3 Pro和當(dāng)貝Smart1兩款家用投影儀以其各自獨特的功能和優(yōu)勢,吸引了眾多消費者的…

陳晨
17小時前
產(chǎn)經(jīng)

激光投影儀怎么選？當(dāng)貝推出全新超級投影F7 Pro，4K+護眼三色激光

在家庭影院逐漸成為現(xiàn)代家居的標(biāo)配之時,激光投影儀以其卓越的畫質(zhì)和色彩表現(xiàn)力,成為了許多家庭升級觀影體驗的首選。然而,面對市場上眾多品牌和型號的激光投影儀,如何挑選一款性價比高、性能…

陳晨
17小時前
產(chǎn)經(jīng)

7000元價位投影儀怎么選？當(dāng)貝推出F7 Pro，4K+護眼三色激光

在7000元價位選擇投影儀時,消費者面臨諸多選擇,而一款優(yōu)質(zhì)的投影儀能夠為您的家庭帶來極佳的觀影體驗。以下是幾個關(guān)鍵要點,幫助您在這個價位段內(nèi)做出明智的選擇。 ①光源技術(shù):優(yōu)先考慮…

陳晨
17小時前
產(chǎn)經(jīng)

橋田觀點 | 高壁壘細(xì)分領(lǐng)域中國的品牌能夠做些什么？

1959年，美國推出世界第一臺工業(yè)機器人，當(dāng)時的功能還十分簡單，只能用于定點搬運東西。1967年，日本從美國引進第一臺工業(yè)機器人，開啟自主研發(fā)和產(chǎn)業(yè)化之路。在那之后的二十年，日本的…

陳晨
18小時前
產(chǎn)經(jīng)

什么是游戲玩家的“戰(zhàn)斗武器”？ 10月24日京東3C數(shù)碼采銷直播間揭曉答案

京東11.11期間，為滿足游戲玩家對電競筆記本的性能、品質(zhì)、輕薄便攜性的需求，10月24日，AMD大中華區(qū)銷售副總裁晁亞新及機械革命零售業(yè)務(wù)群總經(jīng)理李應(yīng)龍將做客京東3C數(shù)碼采銷直播…

陳晨
18小時前
產(chǎn)經(jīng)

華為攜手光明，共同打造粵港澳大灣區(qū)AI創(chuàng)新高地

10月22日，深圳市光明區(qū)人民政府與深圳華為云計算技術(shù)有限公司簽署了《共同推動光明人工智能應(yīng)用服務(wù)中心合作協(xié)議》。簽約儀式上，深圳市光明區(qū)委常委、區(qū)委區(qū)政府辦公室主任李興亮，華為云…

陳晨
19小時前
產(chǎn)經(jīng)

產(chǎn)品設(shè)計再獲國際認(rèn)可，悅刻榮膺2024繆斯設(shè)計獎

近日，美國國際獎項協(xié)會“繆斯設(shè)計獎” （MUSE Design Awards）公布年度獲獎名單。RELX悅刻在海外市場推出的“悅刻旋風(fēng)”（RELX SPIN）和“悅刻創(chuàng)造者”（RE…

陳晨
19小時前
產(chǎn)經(jīng)

超千款鴻蒙原生游戲上架，華為游戲中心成就非凡游戲體驗

10月22日，原生鴻蒙之夜暨華為全場景新品發(fā)布會在深圳舉行，華為正式為用戶帶來全新的原生鴻蒙操作系統(tǒng)（HarmonyOS NEXT），這是HarmonyOS誕生以來最大的更新。發(fā)布…

陳晨
20小時前
五大舉措打造鄉(xiāng)村振興幫扶“示范田” 中國平安在甘肅舉行支持產(chǎn)業(yè)振興及助農(nóng)協(xié)銷調(diào)研活動

為鞏固拓展脫貧攻堅成果，助力全面推進鄉(xiāng)村振興戰(zhàn)略實施，著力打造鄉(xiāng)村振興定點幫扶示范典型項目，在第七個”中國農(nóng)民豐收節(jié)”到來之際，9月24日-25日，中國平安…

陳晨
產(chǎn)經(jīng) 20小時前
產(chǎn)經(jīng)

買5G選中興放心流量來京東中興U30 Air系列推出三款新品

10月23日，中興通訊推出了三款中興U30 Air 系列5G隨身WiFi新品，包括面向亞太國家或地區(qū)喜歡出游用戶的中興U30 Air亞太版，采用全新太空主題配色、專為大存儲辦公和備…

陳晨
20小時前
產(chǎn)經(jīng)

原生鴻蒙發(fā)布！搭載該系統(tǒng)的華為設(shè)備開機畫面將顯示“Powered by OpenHarmony”

10月22日，在原生鴻蒙之夜暨華為全場景新品發(fā)布會上，華為正式發(fā)布原生鴻蒙操作系統(tǒng)HarmonyOS NEXT，這也是繼蘋果iOS和安卓系統(tǒng)后，全球第三大移動操作系統(tǒng)。據(jù)悉，此次發(fā)…

陳晨
20小時前
產(chǎn)經(jīng)

四大藍(lán)科技滿血集結(jié)，“一超多能”旗艦vivo X200系列發(fā)布

2024年10月14日北京 —— 10月14日，全新一代vivo X200系列旗艦手機在國家游泳中心（水立方）發(fā)布。作為重磅登場的國產(chǎn)旗艦系列，vivo X200系列首…

陳晨
21小時前
擎云智慧政務(wù)全場景解決方案獲2024安防行業(yè)優(yōu)秀解決方案獎助力安防體系高質(zhì)量發(fā)展

10月22日，由中國安全防范產(chǎn)品行業(yè)協(xié)會組織的“2024安防行業(yè)優(yōu)秀解決方案”評選結(jié)果正式揭曉，華為擎云攜手合作伙伴打造的擎云智慧政務(wù)全場景解決方案獲得2024安防行業(yè)優(yōu)秀解決方案…

陳晨
產(chǎn)經(jīng) 21小時前
產(chǎn)經(jīng)

vivo X200全面評測，中杯旗艦的標(biāo)準(zhǔn)答案

最近，vivo攜手聯(lián)發(fā)科帶來了新一代旗艦手機——vivo X200。這款手機不僅繼承了vivo X系列一貫的優(yōu)雅設(shè)計和出色影像實力，還在性能、續(xù)航等多個方面實現(xiàn)了全面升級，為用戶帶…

陳晨
21小時前
鴻蒙生態(tài)蓬勃發(fā)展：超1萬5應(yīng)用和元服務(wù)上架，版本迭代日新月異

10月22日，華為在“原生鴻蒙之夜暨華為全場景新品發(fā)布會”上正式揭曉HarmonyOS NEXT。截至目前，鴻蒙生態(tài)設(shè)備數(shù)量已突破10億，超15000個應(yīng)用和元服務(wù)上架Harmon…

陳晨
產(chǎn)經(jīng) 21小時前

發(fā)表回復(fù)

登錄后才能評論

華為云發(fā)布EMS彈性內(nèi)存存儲服務(wù) 打破大模型訓(xùn)練瓶頸

相關(guān)推薦

發(fā)表回復(fù)