寒武紀(jì)發(fā)布第三代云端AI芯片思元370

昨日,寒武紀(jì)發(fā)布第三代云端AI芯片思元370、基于思元370的兩款加速卡MLU370-S4和MLU370-X4、全新升級(jí)的Cambricon Neuware軟件棧。

昨日,寒武紀(jì)發(fā)布第三代云端AI芯片思元370、基于思元370的兩款加速卡MLU370-S4和MLU370-X4、全新升級(jí)的Cambricon Neuware軟件棧。

基于7nm制程工藝,思元370是寒武紀(jì)首款采用chiplet(芯粒)技術(shù)的AI芯片,集成了390億個(gè)晶體管,最大算力高達(dá)256TOPS(INT8),是寒武紀(jì)第二代產(chǎn)品思元270算力的2倍。憑借寒武紀(jì)最新智能芯片架構(gòu)MLUarch03,相較于峰值算力的提升,思元370實(shí)測(cè)性能表現(xiàn)更為優(yōu)秀:以ResNet-50為例,MLU370-S4加速卡(半高半長(zhǎng))實(shí)測(cè)性能為同尺寸主流GPU的2倍;MLU370-X4加速卡(全高全長(zhǎng))實(shí)測(cè)性能與同尺寸主流GPU相當(dāng),能效則大幅領(lǐng)先。

思元370也是國(guó)內(nèi)第一顆支持LPDDR5內(nèi)存的云端AI芯片,內(nèi)存帶寬是上一代產(chǎn)品的3倍,訪存能效達(dá)GDDR6的1.5倍。

同時(shí),寒武紀(jì)全新升級(jí)了Cambricon Neuware軟件棧,新增推理加速引擎MagicMind,實(shí)現(xiàn)訓(xùn)推一體,顯著提升了開(kāi)發(fā)部署的效率,降低用戶的學(xué)習(xí)成本、開(kāi)發(fā)成本和運(yùn)營(yíng)成本。

新一代智能處理器架構(gòu)MLUarch03

寒武紀(jì)智能處理器架構(gòu)MLUarch03,擁有新一代張量運(yùn)算單元,內(nèi)置Supercharger模塊大幅提升各類(lèi)卷積效率;采用全新的多算子硬件融合技術(shù),在軟件融合的基礎(chǔ)上大幅減少算子執(zhí)行時(shí)間;片上通訊帶寬是上一代MLUarch02的2倍、片上共享緩存容量最高是MLUarch02的2.75倍;推出全新MLUv03指令集,更完備,更高效且向前兼容。

有7nm先進(jìn)工藝和全新MLUarch03架構(gòu)的加持,思元370芯片算力最高可達(dá)256TOPS(INT8),是上一代產(chǎn)品思元270算力的2倍。相較于峰值算力的提升,思元370在實(shí)測(cè)性能和能效方面的表現(xiàn)更為優(yōu)秀:以ResNet-50為例,MLU370-S4加速卡(半高半長(zhǎng))實(shí)測(cè)性能為同尺寸主流GPU的2倍;MLU370-X4加速卡(全高全長(zhǎng))實(shí)測(cè)性能與同尺寸主流GPU相當(dāng),能效則大幅領(lǐng)先。

原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/540852.html

若安丶的頭像若安丶管理團(tuán)隊(duì)

相關(guān)推薦