國際權(quán)威 MLPerf 存儲(chǔ)基準(zhǔn)測試發(fā)布 焱融存儲(chǔ)斬獲多項(xiàng)世界第一

       近日,全球權(quán)威 AI 基準(zhǔn)測評(píng)組織 MLCommons? 公布了 MLPerf? v1.0 存儲(chǔ)性能基準(zhǔn)測試的結(jié)果。焱融科技在此次測試中表現(xiàn)出色,焱融全閃存儲(chǔ)產(chǎn)品在 3D-Unet、ResNet50 和 CosmoFlow 三種 AI 深度學(xué)習(xí)模型的評(píng)估中均展現(xiàn)了卓越的性能和效率。

國際權(quán)威 MLPerf 存儲(chǔ)基準(zhǔn)測試發(fā)布 焱融存儲(chǔ)斬獲多項(xiàng)世界第一

       焱融科技作為中國自主研發(fā)的高性能存儲(chǔ)領(lǐng)導(dǎo)者,與 DDN、Nutanix、Weka、Hammerspace、Solidigm 和 Micron 等眾多國際優(yōu)秀廠商同場競技,測試結(jié)果顯示,在帶寬、模擬 GPU 數(shù)量以及 GPU 利用率等關(guān)鍵性能指標(biāo)上,焱融科技的產(chǎn)品獲得了多項(xiàng)世界第一。

國際權(quán)威 MLPerf 存儲(chǔ)基準(zhǔn)測試發(fā)布 焱融存儲(chǔ)斬獲多項(xiàng)世界第一

       在 MLPerf? Storage v1.0 的基準(zhǔn)測試中,焱融全閃存儲(chǔ)顯著提升了 GPU/ML 工作負(fù)載的處理速度,這表明焱融高性能存儲(chǔ)產(chǎn)品具備支持各種 AI 模型訓(xùn)練和高性能計(jì)算場景的能力。在 AI 領(lǐng)域,尤其是在大規(guī)模模型訓(xùn)練方面,焱融全閃存存儲(chǔ)解決方案發(fā)揮著至關(guān)重要的作用,為 AI 技術(shù)的發(fā)展和應(yīng)用提供了強(qiáng)有力的支持。

       MLPerf? Storage 全球首個(gè)且唯一的 AI/ML 存儲(chǔ)基準(zhǔn)測試

       MLPerf 是由圖靈獎(jiǎng)得主大衛(wèi)·帕特森(David Patterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等頂尖學(xué)術(shù)機(jī)構(gòu)共同發(fā)起的國際權(quán)威 AI 性能基準(zhǔn)測試,被譽(yù)為全球 AI 領(lǐng)域的“奧運(yùn)會(huì)”。MLCommons 組織在 2023 年首次推出了 MLPerf 存儲(chǔ)基準(zhǔn)測試(MLPerf Storage Benchmark),這是首個(gè)也是目前唯一一個(gè)開源、公開透明的 AI/ML 基準(zhǔn)測試,旨在評(píng)估存儲(chǔ)系統(tǒng)在 ML/AI 工作負(fù)載中的表現(xiàn)。這一基準(zhǔn)測試為 ML/AI 模型開發(fā)者選擇存儲(chǔ)解決方案提供了權(quán)威的參考依據(jù),幫助他們?cè)u(píng)估合適的存儲(chǔ)產(chǎn)品。

       MLPerf Storage 基準(zhǔn)測試目前有兩個(gè)版本:v0.5 和 v1.0。2023 年發(fā)布的 v0.5 版本初步包含了 Unet-3D 和 BERT 兩個(gè)模型,并僅支持模擬 NVIDIA v100 GPU。而今年最新發(fā)布的 v1.0 版本進(jìn)行了重大更新,引入了更具代表性的測試模型,這些模型在業(yè)界具有廣泛的應(yīng)用,能夠更好地代表實(shí)際工作負(fù)載

國際權(quán)威 MLPerf 存儲(chǔ)基準(zhǔn)測試發(fā)布 焱融存儲(chǔ)斬獲多項(xiàng)世界第一

       焱融存儲(chǔ)國內(nèi)唯一全面參與所有模型測試的廠商 榮登多項(xiàng)世界第一

       焱融科技參與 MLPerf 測試使用了最新發(fā)布的 F9000X 全閃分布式一體機(jī)產(chǎn)品。F9000X 每個(gè)存儲(chǔ)節(jié)點(diǎn)搭載最新的英特爾? 至強(qiáng)? 第 5 代可擴(kuò)展處理器,存儲(chǔ)介質(zhì)采用 10 塊 Memblaze PCIE 5.0 NVMe 閃存 ,同時(shí)配備 2 塊 NVIDIA ConnectX-7 400Gb NDR 網(wǎng)卡。

       最全面最完整,國內(nèi)唯一一家參加了全部模型測試的存儲(chǔ)廠商

       焱融科技是國內(nèi)唯一一家參與了 MLPerf Storage 全部模型測試的存儲(chǔ)廠商,包括 3D-Unet、CosmoFlow 和 ResNet 50。在測試環(huán)節(jié)中,焱融追光全閃存儲(chǔ)一體機(jī) F9000X 展現(xiàn)了卓越的性能,全面覆蓋目前主流模型應(yīng)用數(shù)據(jù)負(fù)載需求。F9000X 不僅能夠處理大規(guī)模的數(shù)據(jù)集,還可以根據(jù) AI 集群規(guī)模彈性擴(kuò)展,完美匹配 GPU 算力性能。

       在分布式訓(xùn)練集群場景,平均每個(gè)計(jì)算節(jié)點(diǎn) ACC 數(shù)量最多,存儲(chǔ)帶寬最高

       MLPerf Storage 基準(zhǔn)測試規(guī)則定義可以采用單個(gè)計(jì)算節(jié)點(diǎn)(客戶端)運(yùn)行多個(gè) ACC(Accelerator,GPU 加速器),進(jìn)行相應(yīng)模型應(yīng)用測試,同時(shí)支持大規(guī)模分布式訓(xùn)練集群場景,多個(gè)客戶端模擬真實(shí)數(shù)據(jù)并行的方式并發(fā)訪問存儲(chǔ)集群。其中平均每個(gè)客戶端能夠運(yùn)行的 ACC 數(shù)量越多,則代表該節(jié)點(diǎn)的計(jì)算能力越強(qiáng),能夠處理任務(wù)的數(shù)量也就越多,而對(duì)于存儲(chǔ)數(shù)據(jù)并發(fā)訪問性能要求也就越高。測試結(jié)果顯示,在分布式訓(xùn)練集群場景,焱融存儲(chǔ)在所有三個(gè)模型的測試中,能夠支撐的每個(gè)計(jì)算節(jié)點(diǎn)平均 ACC 數(shù)量和存儲(chǔ)帶寬性能均排名第一。

國際權(quán)威 MLPerf 存儲(chǔ)基準(zhǔn)測試發(fā)布 焱融存儲(chǔ)斬獲多項(xiàng)世界第一
國際權(quán)威 MLPerf 存儲(chǔ)基準(zhǔn)測試發(fā)布 焱融存儲(chǔ)斬獲多項(xiàng)世界第一

       存儲(chǔ)性能隨計(jì)算規(guī)模同步線性增長

       隨著計(jì)算規(guī)模的擴(kuò)大,存儲(chǔ)性能應(yīng)實(shí)現(xiàn)線性增長以滿足 AI 訓(xùn)練的需求。以 3D-Unet 三維圖像分割模型為例,其單個(gè)圖像樣本大小約為 146MB,而在多節(jié)點(diǎn)集群環(huán)境中,每秒處理的訓(xùn)練樣本數(shù)可超過 1100 個(gè),這導(dǎo)致訓(xùn)練數(shù)據(jù)的讀取帶寬需求超過 160GB/s。

       在針對(duì)三個(gè)模型的測試中,焱融全閃存儲(chǔ)一體機(jī) F9000X 展現(xiàn)了出色的性能。測試結(jié)果顯示:隨著并發(fā)計(jì)算節(jié)點(diǎn)(ACC)數(shù)量的增加,存儲(chǔ)系統(tǒng)的帶寬性能保持明顯的線性增長能力。此外,存儲(chǔ)的可用性(AU,Accelerator Utilization,GPU 加速器利用率)也始終保持在測試基準(zhǔn)要求的范圍內(nèi),確保了訓(xùn)練過程的高效和穩(wěn)定。目前在 3D-Unet 模型應(yīng)用的測試中,使用 3 個(gè)計(jì)算節(jié)點(diǎn),共 60 個(gè) ACC,可達(dá)到 160GB/s 的存儲(chǔ)帶寬性能。F9000X 3 節(jié)點(diǎn)存儲(chǔ)集群實(shí)測最大可以達(dá)到 260GB/s 以上的帶寬性能,這表明在實(shí)際業(yè)務(wù)環(huán)境中焱融全閃存可以支撐更多的 GPU 的計(jì)算節(jié)點(diǎn)。

       焱融科技在AI和高性能計(jì)算領(lǐng)域,憑借其深厚的技術(shù)積累和持續(xù)創(chuàng)新,已成為推動(dòng)行業(yè)發(fā)展的關(guān)鍵力量。在MLPERF Storage V1.0基準(zhǔn)測試中,焱融科技首次參與便取得領(lǐng)先地位,標(biāo)志著其數(shù)據(jù)存儲(chǔ)技術(shù)達(dá)到行業(yè)新高度。焱融科技的全閃分布式存儲(chǔ)一體機(jī)追光F9000X,以其卓越的性能滿足了日益增長的高性能計(jì)算需求,實(shí)現(xiàn)了數(shù)據(jù)存儲(chǔ)領(lǐng)域的重大突破。這一產(chǎn)品不僅提升了數(shù)據(jù)處理能力,還為人工智能、高性能計(jì)算、自動(dòng)駕駛、生物信息分析和金融量化等前沿領(lǐng)域的發(fā)展提供了強(qiáng)大支持。

本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:http://articlef.yulepops.com/article/m-164/1/312202409291741341774524.html

陳晨陳晨管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論