MaaS突破“臨界點(diǎn)”,全棧Serverless化再升級,阿里云如何重塑云計(jì)算技術(shù)體系?

2009 年,飛天的第一行代碼敲在了阿里云最早的辦公室里,也敲在了國內(nèi)云計(jì)算的里程碑上。十幾年后的今天,我們?nèi)匀荒軌蚩吹竭@股創(chuàng)新力量在阿里云不斷匯聚,等待某一刻的爆發(fā),而這一刻似乎已經(jīng)到來。早在今年 4 月的阿里云峰會(huì)上,阿里巴巴集團(tuán)董事會(huì)主席兼首席執(zhí)行官、阿里云智能集團(tuán) CEO 張勇表示,目前阿里云已形成了全棧的技術(shù)服務(wù),搭建了模型即服務(wù)(MaaS)、平臺(tái)即服務(wù)(PaaS)、基礎(chǔ)設(shè)施即服務(wù)(IaaS)三層架構(gòu)。在此之后,阿里云推出了“飛天發(fā)布時(shí)刻”這一產(chǎn)品技術(shù)發(fā)布平臺(tái),并開始以這一平臺(tái)高頻地對外發(fā)布在智能時(shí)代云計(jì)算創(chuàng)新體系下的一系列新技術(shù)和新產(chǎn)品。在剛剛過去的 7 月 31 日,飛天發(fā)布時(shí)刻再次帶來了一系列新產(chǎn)品,并引發(fā)了業(yè)內(nèi)對智能時(shí)代云計(jì)算技術(shù)體系相關(guān)理念的關(guān)注。

一直以來,業(yè)界對于 MaaS 存在諸多討論。那么,MaaS 理念之下是否實(shí)現(xiàn)了業(yè)務(wù)場景的適配與落地?被熱議的全棧 Serverless 化做到了哪一步?對企業(yè)和開發(fā)者又有何價(jià)值?云廠商如何才能真正做到“普惠”?什么樣的云計(jì)算體系架構(gòu)適合智能時(shí)代?本文將針對上述問題進(jìn)行探討并尋找答案。

、MaaS 理念下如何實(shí)現(xiàn)大模型能力產(chǎn)品化?

AI 浪潮下,作為大模型底層基石的云計(jì)算發(fā)生了新的變化。當(dāng)前階段,云廠商已經(jīng)基本達(dá)成共識(shí):AI 與云計(jì)算互生互融成為必然趨勢,應(yīng)用將大規(guī)模建立在大模型上。與此同時(shí),業(yè)界在討論大模型時(shí)普遍提到了一個(gè)關(guān)鍵詞:MaaS。

MaaS 是什么?去年 11 月,阿里云在云棲大會(huì)上首次提出了 MaaS(Model-as-a-service ,模型即服務(wù))概念。阿里云 CTO 周靖人曾對 MaaS 做了如下表述“MaaS 最底層的含義是要把模型作為重要的生產(chǎn)元素,圍繞模型的生命周期設(shè)計(jì)產(chǎn)品和技術(shù),從模型的開發(fā)入手,包括數(shù)據(jù)處理、特征工程、模型的訓(xùn)練和調(diào)優(yōu)、模型的服務(wù)等,提供各種各樣的產(chǎn)品和技術(shù)?!笨梢悦鞔_的一點(diǎn)是,MaaS 并非一個(gè)技術(shù)層,而是一種理念。

MaaS突破“臨界點(diǎn)”,全棧Serverless化再升級,阿里云如何重塑云計(jì)算技術(shù)體系?

隨著“百模大戰(zhàn)”日趨白熱化,MaaS 理念成為越來越多大廠選擇的商業(yè)路徑。MaaS 是否能重塑云計(jì)算改變云計(jì)算的游戲規(guī)則,目前定論還尚早。但可以肯定的是,以往的 PaaS 和 SaaS 架構(gòu)都將被置于大模型的底層能力之上,大模型將成為生產(chǎn)要素,在各行業(yè)釋放力量。

盡管大模型對未來的顛覆性影響已成為共識(shí),但是我們?nèi)匀恍枰鎸Φ默F(xiàn)實(shí)是,國內(nèi)對大模型的探索處在早期階段,多數(shù)企業(yè)對于大模型仍然持有觀望態(tài)度,原因在于其在業(yè)務(wù)場景適配與落地上存在較大難題。當(dāng)各大廠正在跟隨 MaaS 理念紛紛研發(fā)自己的大模型或者尋找大模型落地場景時(shí),阿里云已經(jīng)實(shí)現(xiàn)了大模型能力的產(chǎn)品化。

今年的 WAIC 大會(huì)上,阿里云通義大模型家族揭開了最新成員的面紗,基于自研的組合式生成模型 Composer 的 AI 繪畫創(chuàng)作大模型——通義萬相。其實(shí),在這之前阿里云已先后發(fā)布了超大規(guī)模的語言模型——“通義千問”和專攻音視頻生產(chǎn)力的 AI 產(chǎn)品“通義聽悟”。至此,阿里云在 AI 的三大主要方向全部打通。

“面向 AI 時(shí)代,所有產(chǎn)品都值得用大模型重新升級?!笔前⒗镌茖Υ竽P彤a(chǎn)業(yè)落地的判斷。當(dāng)所有聚光燈都打在兩個(gè)月內(nèi)迅速誕生的通義千問和通義萬相兩個(gè)大模型上時(shí),阿里云已經(jīng)同步實(shí)現(xiàn)了諸多產(chǎn)品的智能升級,通義聽悟、釘釘都是其中的先行者。

通義聽悟是一款面向工作和學(xué)習(xí)的 AI 助手,通義聽悟強(qiáng)大的理解能力背后除了以自研的通義千問大模型為基座,更重要的是內(nèi)置了阿里云新一代工業(yè)級語音識(shí)別模型 Paraformer,這是業(yè)界首個(gè)應(yīng)用落地的非自回歸端到端語音識(shí)別模型,在推理效率上最高可較傳統(tǒng)模型提升 10 倍。最新數(shù)據(jù)顯示,通義聽悟在發(fā)布首月累計(jì)訪問用戶數(shù) 49.1w。

除此之外,通義大模型能力也足以賦能其他企業(yè)級產(chǎn)品。在釘釘宣布全面接入通義千問大模型的 3 個(gè)月之后,我們看到了大模型對企業(yè)級產(chǎn)品智能化升級的真正實(shí)力。知識(shí)庫、Teambition、白板等加入 AI 能力,釘釘 12 條產(chǎn)品線、40 多項(xiàng)場景接入大模型。用戶通過斜杠“/”輸入自然語言,即可生成 PPT、思維導(dǎo)圖、數(shù)據(jù)分析圖表、項(xiàng)目看板等。在智能化升級中,釘釘將大模型深度融入到工作流程的各個(gè)環(huán)節(jié),用戶可以在釘釘上完成從溝通到協(xié)作、從創(chuàng)意到實(shí)現(xiàn)、從管理到?jīng)Q策的全流程并能充分感受到大模型交互與理解能力所帶來的新功能、新體驗(yàn)。

在開發(fā)者生態(tài)層面,為進(jìn)一步降低大模型使用門檻,阿里云推出國內(nèi)首款大模型調(diào)用工具魔搭 GPT(ModelScopeGPT),它能接收用戶指令,通過“中樞模型”一鍵調(diào)用魔搭社區(qū)其他的 AI 模型,大小模型協(xié)同完成復(fù)雜任務(wù)。魔搭 GPT 現(xiàn)已能夠調(diào)用魔搭社區(qū)十多個(gè)核心 AI 模型的 API,未來隨著更多模型 API 的加入,魔搭 GPT 的能力也將不斷增強(qiáng)。構(gòu)建這一模型調(diào)用工具的數(shù)據(jù)集和訓(xùn)練方案將會(huì)對外開放,供開發(fā)者自行使用,開發(fā)者可以根據(jù)需要對不同的大模型和小模型進(jìn)行組合。值得一提的是,就在昨天,阿里云通義千問開源。AI 模型社區(qū)魔搭 ModelScope 上架兩款開源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云確認(rèn)其為通義千問 70 億參數(shù)通用模型和對話模型,兩款模型均開源、免費(fèi)、可商用。在多個(gè)權(quán)威測評中,通義千問 7B 模型取得了遠(yuǎn)超國內(nèi)外同等尺寸模型的效果,成為當(dāng)下業(yè)界最強(qiáng)的中英文 7B 開源模型。

MaaS突破“臨界點(diǎn)”,全棧Serverless化再升級,阿里云如何重塑云計(jì)算技術(shù)體系?

從通義聽悟到釘釘再到魔搭 GPT,我們看到阿里云在用戶層面、企業(yè)層面、開發(fā)者層面實(shí)現(xiàn)了大模型產(chǎn)品化的全面布局。這也意味著,阿里云最先實(shí)現(xiàn)了在 MaaS 理念之下大模型與業(yè)務(wù)場景的創(chuàng)新落地。然而,大廠的理念再先進(jìn)、產(chǎn)品落地再好,普通企業(yè)和開發(fā)者要想玩轉(zhuǎn) AI,尤其是在云上玩轉(zhuǎn) AI,依舊難度不小,降低 AI 開發(fā)甚至應(yīng)用開發(fā)的門檻,是開發(fā)者們提出的訴求,也是云廠商最重要的功課之一。

、降低 AI 開發(fā)門檻,全棧 Serverless 化,做高質(zhì)量的 PaaS 層

大模型浪潮,率先將算力推至風(fēng)口浪尖。據(jù) OpenAI 測算,全球 AI 訓(xùn)練所用的計(jì)算量呈現(xiàn)指數(shù)級增長,平均每 3.43 個(gè)月便會(huì)增長一倍,目前計(jì)算量已擴(kuò)大 30 萬倍,遠(yuǎn)超算力增長速度。國家信息中心發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》顯示,當(dāng)前我國超過 30 個(gè)城市正在建設(shè)或提出建設(shè)智算中心,但仍然無法滿足相關(guān)需求。

打造一個(gè) AI 大模型究竟需要多少算力?據(jù)公開數(shù)據(jù)顯示,ChatGPT 初始所需的算力就是 1 萬塊英偉達(dá) A100,價(jià)格超過 7 億元。后續(xù)的調(diào)優(yōu)訓(xùn)練每天消耗算力大概是 3640PFLOPS,需要 7 至 8 個(gè)算力達(dá) 500PFLOPS 的數(shù)據(jù)中心支持,建設(shè)成本約為三、四十億元。

然而,提供算力的所有 GPU 不能只是簡單堆砌,更需要讓所有算力聯(lián)合起來為模型訓(xùn)練服務(wù)。大模型的訓(xùn)練和推理過程需要海量數(shù)據(jù)資源,相比于傳統(tǒng)中央處理器 CPU,GPU 擁有上千個(gè)小型處理核心,能夠同時(shí)處理大規(guī)模數(shù)據(jù)的并行計(jì)算任務(wù),運(yùn)算速度更快。憑借這些優(yōu)勢成為了智能計(jì)算的理想選擇。但是,算力的構(gòu)成并不僅僅只是 GPU 加速芯片,還需要構(gòu)建包括網(wǎng)絡(luò)互聯(lián)、操作系統(tǒng)、深度學(xué)習(xí)框架以及相應(yīng) SDK、算法與應(yīng)用程序等,形成一個(gè)完整的計(jì)算生態(tài)系統(tǒng),通過體系化的技術(shù)支撐匯聚 AI 算力。

而智算服務(wù) PAI-靈駿恰恰就能將這一體系整合。智算服務(wù) PAI-靈駿包含的基礎(chǔ)設(shè)施層的 RDMA 網(wǎng)絡(luò)和融合算力集群、智算工程平臺(tái)和智算資產(chǎn)管理以及強(qiáng)大的 Serverless 化的調(diào)度能力和運(yùn)維管控能力等,都助力開發(fā)者擺脫堆砌算力的老路。

同時(shí),智算服務(wù) PAI-靈駿面向大規(guī)模深度學(xué)習(xí)及融合計(jì)算場景,一站式地提供覆蓋 Al 開發(fā)全流程的工程平臺(tái)和深度優(yōu)化的融合算力,支撐了 10 萬億參數(shù)規(guī)模的大型模型訓(xùn)練。基于 PAI-靈駿智算服務(wù),單訓(xùn)練任務(wù)可達(dá)萬卡級別規(guī)模,訓(xùn)練性能可提高近 10 倍,千卡規(guī)模的線性擴(kuò)展效率達(dá) 92%,極大降低 AI 開發(fā)門檻。

智算服務(wù) PAI-靈駿本質(zhì)上是一個(gè) Serverless 化的產(chǎn)品,為 AI 開發(fā)新范式提供了 Serverless 化的平臺(tái)支持。而在 AI 開發(fā)之外,Serverless 也已經(jīng)是大家普遍認(rèn)同的應(yīng)用開發(fā)的范式。根據(jù) Gartner 預(yù)測,到 2025 年將會(huì)有 50% 以上的全球企業(yè)采用 Serverless 化架構(gòu)。為什么越來越多企業(yè)會(huì)使用 Serverless ?

Serverless 的核心目的是在云計(jì)算的基礎(chǔ)上,徹底“包攬”所有的環(huán)境工作,直接提供計(jì)算服務(wù)。在 Serverless 架構(gòu)下,開發(fā)者只需編寫代碼并上傳,云平臺(tái)就會(huì)自動(dòng)準(zhǔn)備好相應(yīng)的計(jì)算資源,完成運(yùn)算并輸出結(jié)果,從而大幅簡化開發(fā)運(yùn)維過程。隨著企業(yè)數(shù)字化進(jìn)程加快,Serverless 的全托管服務(wù)、自適性彈性、按實(shí)際用量計(jì)費(fèi)等特點(diǎn)越來越滿足企業(yè)的業(yè)務(wù)需求。

Serverless 的價(jià)值不言自明,但是要想讓用戶用好 Serverless,單純在應(yīng)用運(yùn)行時(shí)層面進(jìn)行 Serverless 化是遠(yuǎn)遠(yuǎn)不夠的,應(yīng)用依賴的下游數(shù)據(jù)庫等系統(tǒng),如果沒有良好的彈性,就會(huì)成為系統(tǒng)整體的“短板”。

全面實(shí)現(xiàn) Serverless 化取決于整個(gè)研發(fā)鏈路上有多少云產(chǎn)品提供了這樣的形態(tài)。阿里云是國內(nèi)對 Serverless 探索最早的廠商之一,其于 2017 年推出了函數(shù)計(jì)算產(chǎn)品 FC,2018 年推出了 Serverless 應(yīng)用引擎 SAE 和 Serverless 容器服務(wù) ASK,2020 年開源了 Serverless Devs,2021 年阿里云 Serverless 產(chǎn)品能力在 Forrester 評測中拿下國內(nèi)第一  ,2022 年 Serverless 應(yīng)用中心發(fā)布……在去年的云棲大會(huì)上,阿里云宣布全棧 Serverless 化之后,業(yè)內(nèi)都在期待相關(guān)成果。

“讓云計(jì)算從資源真正變成一種能力”,阿里云一直堅(jiān)定地推進(jìn)全棧 Serverless 化并通過多年的 Serverless 產(chǎn)品創(chuàng)新積淀等待新的突破。

在本周一的飛天發(fā)布時(shí)刻上,阿里云陸續(xù)帶來了 Serverless 領(lǐng)域的最新進(jìn)展:函數(shù)計(jì)算 FC 與 AIGC 的創(chuàng)新融合、容器服務(wù) Serverless 版(ACK Serverless)以及 Serverless 應(yīng)用引擎 SAE2.0。這意味著,阿里云在全棧 Serverless 化又前進(jìn)了一步。

在權(quán)威咨詢機(jī)構(gòu) Forrester 發(fā)布的最新全球 FaaS 能力報(bào)告中,阿里云函數(shù)計(jì)算憑借產(chǎn)品能力在 40 個(gè)嚴(yán)苛的評分項(xiàng)目中拿下 24 個(gè)最高分,綜合穩(wěn)居領(lǐng)導(dǎo)者象限,成為國內(nèi)唯一兩度進(jìn)入該象限的科技公司。函數(shù)計(jì)算的產(chǎn)品實(shí)力加速了與 AIGC 的創(chuàng)新落地。

MaaS突破“臨界點(diǎn)”,全棧Serverless化再升級,阿里云如何重塑云計(jì)算技術(shù)體系?

面對應(yīng)用開發(fā)的高門檻,阿里云函數(shù)計(jì)算整合了 AIGC 應(yīng)用開發(fā),集結(jié)經(jīng)典的 AIGC 模版,5 分鐘就可以完成 AIGC 應(yīng)用部署,使模型托管的難度降低、效率提高。

阿里云的容器服務(wù) Serverless 版,則是將 ACK 和 ASK 兩款產(chǎn)品融合,在彈性能力和調(diào)度能力上實(shí)現(xiàn)了更大提升。例如,升級了智能彈性預(yù)測 AHPA,相比人工配置,彈性準(zhǔn)確率提升 80%;基于庫存感知調(diào)度和可用區(qū)打散調(diào)度,提高了彈性的確定性以及應(yīng)用的高可用性。

全托管、免運(yùn)維、高彈性是 SAE 的主要特點(diǎn),本次升級的 SAE2.0 將研發(fā)運(yùn)維提效 50%、應(yīng)用成本下降 40% 以上并實(shí)現(xiàn)百毫秒級彈性伸縮,應(yīng)用冷啟動(dòng)提效,支持縮容到 0,這對于新興業(yè)務(wù)以及一些創(chuàng)新創(chuàng)業(yè)的公司更加友好。

我們看到,從智算服務(wù) PAI-靈駿到全棧 Serverless 化的最新進(jìn)展,都是在降低 AI 開發(fā)門檻和應(yīng)用開發(fā)門檻,背后的本質(zhì)是云計(jì)算技術(shù)的不斷創(chuàng)新與發(fā)展,而云計(jì)算技術(shù)創(chuàng)新和發(fā)展的終極目標(biāo)則是降低算力成本,讓每個(gè)企業(yè)甚至每個(gè)人都能用得起、用得好算力,讓計(jì)算真正成為公共服務(wù)。

、創(chuàng)新與規(guī)模效應(yīng)加持下,將“普惠”進(jìn)行到底  

目前,國內(nèi)大部分算力掌握在少數(shù)廠商手里,而云廠商占了很大比重。算力,在很多情況下成為了想法落地的最關(guān)鍵一環(huán),是很多機(jī)構(gòu)和企業(yè)邁不過去的坎。

普惠在任何行業(yè)都是具有巨大價(jià)值的事情,算力普惠更是如此。但做這件事情是有門檻的,首先就是技術(shù)創(chuàng)新。阿里云掌握著國內(nèi)云計(jì)算核心技術(shù)體系,擁有自研軟硬件一體研發(fā)系統(tǒng),例如,自研 CPU 倚天 710、云數(shù)據(jù)中心處理器 CIPU 以及飛天操作系統(tǒng),構(gòu)建了從芯片、板卡、服務(wù)器、操作系統(tǒng)和上層云原生應(yīng)用軟件、數(shù)據(jù)庫等核心云基礎(chǔ)設(shè)施。阿里云對軟硬件一體技術(shù)整合的持續(xù)大力投入所推動(dòng)的算力提升、資源調(diào)度能力增強(qiáng)、以及細(xì)顆粒度的運(yùn)營,是阿里云能夠降本讓利的底氣所在。

讓更多企業(yè)和開發(fā)者享受到云計(jì)算的紅利,是阿里云的初心。

降低開發(fā)者的獲取門檻是阿里云“普惠”的重要一步。今年 4 月中旬,阿里云推出了“飛天免費(fèi)試用計(jì)劃”,面向 1000 萬云上開發(fā)者,提供核心云產(chǎn)品的免費(fèi)試用,最長達(dá)三個(gè)月,可支持開發(fā)者構(gòu)建包括業(yè)務(wù)在線、大數(shù)據(jù)類、AI 等不同類型應(yīng)用,并且支持 Serverless 的開發(fā)模式。

目前該計(jì)劃也推出了國際版,涵蓋 50 多款產(chǎn)品,包括 ECS t5 實(shí)例的一年期免費(fèi)試用、PolarDB 數(shù)據(jù)庫永久免費(fèi)試用,以及指定規(guī)格試用期滿折扣續(xù)費(fèi)等多種產(chǎn)品優(yōu)惠。據(jù)悉,阿里云還將進(jìn)一步擴(kuò)大免費(fèi)試用范圍,針對學(xué)生、中小企業(yè)的專屬免費(fèi)試用計(jì)劃也在籌備中。

成本是云計(jì)算發(fā)展的命門,在降低用戶成本上,阿里云展現(xiàn)了最大的決心和誠意。今年的 4 月阿里云宣布核心產(chǎn)品價(jià)格全線下調(diào) 15%-50%,存儲(chǔ)產(chǎn)品最高降價(jià) 50%。例如,彈性計(jì)算 7 代實(shí)例和倚天實(shí)例降價(jià)最高 20%,存儲(chǔ) OSS 深度冷歸檔降價(jià) 50%,網(wǎng)絡(luò)負(fù)載均衡 SLB 降價(jià) 15%,數(shù)據(jù)庫 RDS 倚天版降價(jià)最高 40%。被外界稱為“阿里云有史以來規(guī)模最大的降價(jià)”。

然而,降本并不等于降價(jià)也不是價(jià)格戰(zhàn),而是通過產(chǎn)品優(yōu)化和規(guī)模效應(yīng)帶來 IT 總成本的降低。

作為國際領(lǐng)先的云計(jì)算廠商,阿里云在過去的十年里持續(xù)降低云計(jì)算的“使用門檻”。其提供的算力成本下降了 80%,存儲(chǔ)成本下降了近 90%。在不斷降價(jià)的過程中,阿里云所期待的是聯(lián)合更多分銷商和集成商一起,擴(kuò)大云的用戶基數(shù)和規(guī)模,推動(dòng)更多產(chǎn)業(yè)進(jìn)一步從傳統(tǒng) IT 向云計(jì)算轉(zhuǎn)移,提高計(jì)算資源的利用率,帶動(dòng)算力成本不斷下降。利用技術(shù)改進(jìn)、規(guī)模效應(yīng)釋放讓利空間,價(jià)格下降又為技術(shù)改進(jìn)、規(guī)模增長帶來更多推力的正循環(huán)。

即便降低用戶成本,但是阿里云在安全層面并不打折扣。特別是在降低企業(yè)確保業(yè)務(wù)安全穩(wěn)定運(yùn)行的成本上。例如,云安全中心的多云統(tǒng)管能力和辦公安全平臺(tái)的輕量版。尤其是辦公安全平臺(tái)的輕量版,適合中小企業(yè)使用的同時(shí),核心功能和標(biāo)準(zhǔn)版基本一致且價(jià)格只有標(biāo)準(zhǔn)版的不到 10%??梢钥闯觯⒗镌茖χ行∑髽I(yè)的關(guān)注與支持印證了其普惠理念。

四、寫在最后

從 MaaS 理念下的大模型能力的產(chǎn)品化,到 PaaS 層技術(shù)迭代與積淀迸發(fā),再到 IaaS 層創(chuàng)新與規(guī)模效應(yīng)下的成本降低。在這些產(chǎn)品和理念的背后,我們看到阿里云是“一家云計(jì)算產(chǎn)品公司”的核心定位,并堅(jiān)定走向“產(chǎn)品被集成”。大模型時(shí)代,企業(yè)都在探索新的商業(yè)模式和生存之道,對于企業(yè)而言,找到靠譜的合作伙伴是未來發(fā)展的重要一步,阿里云趟出了一條可能路徑并走在了最前面。我們需要給先行者們更多的時(shí)間,來共同建立適合智能時(shí)代的云計(jì)算體系。

原創(chuàng)文章,作者:陳晨,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/575014.html

陳晨陳晨管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論