缺乏數(shù)據(jù)源?超算安騰助力開啟AI藥物研發(fā)新范式

“既然計(jì)算機(jī)輔助設(shè)計(jì)行業(yè)捧出了第一家2萬億美元市值的芯片公司,計(jì)算機(jī)輔助藥物發(fā)現(xiàn)行業(yè)為什么不能打造下一個(gè)價(jià)值萬億美元的藥物公司呢?”英偉達(dá)醫(yī)療保健副總裁Kimberly Powell說道。

是的,當(dāng)ChatGPT橫空出世時(shí),它向人類展現(xiàn)出的強(qiáng)大能力正在不斷影響著世界,醫(yī)藥行業(yè)也不例外。Kimberly Powell的觀點(diǎn)表現(xiàn)出她對(duì)AI技術(shù)在醫(yī)藥領(lǐng)域的潛在價(jià)值充滿了信心。事實(shí)上,早在2020年,“AI+生物醫(yī)藥“相關(guān)的概念就曾在國內(nèi)掀起過一波熱潮。據(jù)中信證券研報(bào)顯示,當(dāng)年國內(nèi)AI制藥賽道投融資額超31億元,較前一年增長高達(dá)近7倍。截止2023年,據(jù)不完全統(tǒng)計(jì),中國AI制藥公司已經(jīng)達(dá)到了91家,不少公司都是CRO和自研管線并行。

缺乏數(shù)據(jù)源?超算安騰助力開啟AI藥物研發(fā)新范式

中國AI制藥企業(yè)分布圖 | 圖片來源:智藥局

盡管從資本注入和市場潛力的角度看,AI制藥無疑是一片藍(lán)海,然而審視其研發(fā)成果的實(shí)際轉(zhuǎn)化,自從AI技術(shù)加入醫(yī)療行業(yè)以來,至今仍然沒有任何一支Al預(yù)測的藥物上市,甚至于市面上還沒有任何一款公開進(jìn)入臨床二期的藥物。

相較于活躍的投資環(huán)境,藥物研發(fā)的過程實(shí)則漫長且充滿變數(shù),不僅需要巨額的資金投入,而且面臨極高的研發(fā)失敗風(fēng)險(xiǎn)。AI在此過程中扮演的角色,則是通過大規(guī)模模型的系統(tǒng)訓(xùn)練,使藥物篩選更為迅捷、精準(zhǔn),降低了人為試錯(cuò)成本,并顯著提升了研發(fā)效能。

缺乏數(shù)據(jù)源?超算安騰助力開啟AI藥物研發(fā)新范式

圖片來源于網(wǎng)絡(luò)

AI技術(shù)的三大支柱——算法、算力及數(shù)據(jù)庫,在國內(nèi)AI制藥行業(yè)中,尤其凸顯數(shù)據(jù)庫的關(guān)鍵地位,豐富的數(shù)據(jù)庫資源能確保更高水平的計(jì)算精確度與可靠性,進(jìn)而提升研究成果的品質(zhì)與實(shí)用性。然而,在生物制藥行業(yè)內(nèi),眾多至關(guān)重要的數(shù)據(jù)并非開源,而是源于企業(yè)通過實(shí)驗(yàn)室研究和臨床試驗(yàn)所積累的獨(dú)家資源。與此同時(shí),現(xiàn)有的開源分子數(shù)據(jù)庫往往分布廣泛、下載速度慢、更新頻率各異,難以實(shí)現(xiàn)集中管理和有效利用。因此,建立一個(gè)穩(wěn)定且高效的數(shù)據(jù)庫體系,已成為評(píng)判AI制藥企業(yè)競爭力的核心指標(biāo)。

在缺乏非開源數(shù)據(jù)的情況下,AI制藥企業(yè)采取的一種策略便是通過不斷訓(xùn)練AI系統(tǒng),累積和改進(jìn)數(shù)據(jù)集。比如,運(yùn)用自然語言處理技術(shù)深入挖掘海量學(xué)術(shù)文獻(xiàn)中的有價(jià)值信息,將非結(jié)構(gòu)化的文本數(shù)據(jù)結(jié)構(gòu)化,來為AI模型提供更好的訓(xùn)練材料。另外,利用物理學(xué)建模和仿真技術(shù)創(chuàng)造數(shù)據(jù),特別是在已知藥物靶點(diǎn)的研究中,即使此類數(shù)據(jù)短期內(nèi)可能還不足以直接孕育全新的藥物,但它們對(duì)于訓(xùn)練AI模型理解藥物靶點(diǎn)作用機(jī)制和提升預(yù)測效果具有極高價(jià)值,長遠(yuǎn)看來有助于優(yōu)化藥物研發(fā)流程,縮短新藥上市周期。

然而,構(gòu)建自身的強(qiáng)大數(shù)據(jù)庫是一項(xiàng)耗時(shí)較長的任務(wù),人們不禁要問,是否存在其他途徑可進(jìn)一步加速藥物研發(fā)進(jìn)程?

AI制藥的另一個(gè)出口——專用超算

Relay公司的RLY-4008藥物的成功研發(fā),為AI制藥行業(yè)指出了一個(gè)全新的研發(fā)范式。該公司并未沿襲傳統(tǒng)的依賴于數(shù)據(jù)庫的藥物研發(fā)路徑,而是選擇了運(yùn)用高性能計(jì)算設(shè)備——第二代安騰超級(jí)計(jì)算機(jī)Anton 2,來實(shí)現(xiàn)藥物靶點(diǎn)與候選化合物的分子動(dòng)力學(xué)模擬與精準(zhǔn)篩選設(shè)計(jì)。通過結(jié)合實(shí)驗(yàn)與先進(jìn)計(jì)算技術(shù)的混合研發(fā)模式,Relay大幅縮短了新藥研發(fā)周期,僅用了18個(gè)月、花費(fèi)不到1億美元的成本便成功確定了RLY-4008的結(jié)構(gòu),顛覆了傳統(tǒng)的藥物研發(fā)投入“雙十定律”(即需要投入10年、10億美金才能進(jìn)行藥物研發(fā))。

缺乏數(shù)據(jù)源?超算安騰助力開啟AI藥物研發(fā)新范式

圖片來源:Relay官方

目前,RLY-4008已成功進(jìn)入美國食品藥品監(jiān)督管理局(FDA)主導(dǎo)的二期臨床試驗(yàn)階段,并根據(jù)Relay公布的臨床數(shù)據(jù),在膽管癌患者的治療中,當(dāng)采用推薦劑量時(shí),RLY-4008顯示出驚人的療效,整體緩解率達(dá)到了88.2%,這一數(shù)值在癌癥治療研究中極為突出。這一亮眼成績使得Relay在一眾歷史悠久且實(shí)力雄厚的傳統(tǒng)制藥巨頭中脫穎而出,也充分印證了超級(jí)計(jì)算機(jī)在藥物研發(fā)中所引領(lǐng)的革新力量,預(yù)示著未來的藥物研發(fā)將有望步入超算推動(dòng)的全新時(shí)代。

安騰超級(jí)計(jì)算機(jī)助力顛覆了藥物研發(fā)的“雙十定律”

為Relay提供高性能算力的安騰超級(jí)計(jì)算機(jī),是由美國D. E. Shaw研究所于2007年首次發(fā)布的。與Frontier、神威·太湖之光這類通用型超級(jí)計(jì)算機(jī)不同,安騰超級(jí)計(jì)算機(jī)只專注于分子動(dòng)力學(xué)模擬計(jì)算,并據(jù)此進(jìn)行了底層技術(shù)架構(gòu)的特殊設(shè)計(jì)。這種專業(yè)化的聚焦使得超算安騰在生命科學(xué)研究和生物制藥研發(fā)領(lǐng)域展現(xiàn)出顯著優(yōu)勢。

由于安騰超級(jí)計(jì)算機(jī)只專注分子動(dòng)力學(xué)模擬加速做一件事,所以,其將軟硬件算法進(jìn)行特殊設(shè)計(jì),使得運(yùn)算效率獲得了極大提升。據(jù)悉,超算安騰的計(jì)算效率比全球最強(qiáng)的超算Frontier還要快上近50倍。

缺乏數(shù)據(jù)源?超算安騰助力開啟AI藥物研發(fā)新范式

安騰超級(jí)計(jì)算機(jī) |  圖片來源:網(wǎng)絡(luò)

概括來說,安騰超級(jí)計(jì)算機(jī)采用了專門設(shè)計(jì)的高速三維環(huán)形網(wǎng)絡(luò),將大量定制化的特定應(yīng)用集成電路(ASIC)緊密相連,形成了一個(gè)高度并行且性能卓越的計(jì)算系統(tǒng)。

ASIC芯片針對(duì)特定應(yīng)用進(jìn)行了深度優(yōu)化,如通過定制化數(shù)據(jù)通路和并行計(jì)算架構(gòu),能夠在特定領(lǐng)域?qū)崿F(xiàn)遠(yuǎn)超過通用CPU和GPU的計(jì)算速度和效率,并在處理特定任務(wù)時(shí)表現(xiàn)出更高的可靠性和保密性。與通用超級(jí)計(jì)算機(jī)不同,超算安騰的架構(gòu)特別注重針對(duì)細(xì)粒度事件驅(qū)動(dòng)的運(yùn)算優(yōu)化,并通過計(jì)算與通信的高效重疊來提升整體性能。為了充分利用硬件優(yōu)勢,D. E. Shaw研究所為其設(shè)計(jì)了專用的分子動(dòng)力學(xué)模擬軟件Desmond,與硬件緊密結(jié)合,以實(shí)現(xiàn)針對(duì)特定問題的高效計(jì)算。這樣的軟硬件一體化設(shè)計(jì)使得安騰超級(jí)計(jì)算機(jī)在進(jìn)行分子動(dòng)力學(xué)模擬加速上取得了顯著的競爭優(yōu)勢。

這樣一來,Relay公司的研發(fā)團(tuán)隊(duì)并未完全依賴數(shù)據(jù)庫訓(xùn)練AI模型,而是借助專門針對(duì)分子動(dòng)力學(xué)模擬優(yōu)化的安騰超級(jí)計(jì)算機(jī),得以實(shí)時(shí)可視化蛋白質(zhì)復(fù)雜的動(dòng)態(tài)行為。通過模擬蛋白質(zhì)隨時(shí)間推移的運(yùn)動(dòng)狀態(tài),研究人員能夠深入了解藥物靶點(diǎn)的動(dòng)態(tài)結(jié)構(gòu)特征,進(jìn)而設(shè)計(jì)出與這些靶點(diǎn)結(jié)合親和力更強(qiáng)的小分子藥物。

同時(shí),這種方式彌補(bǔ)了依賴于傳統(tǒng)靜態(tài)成像技術(shù)在揭示蛋白質(zhì)動(dòng)態(tài)功能上的局限,它為藥物開發(fā)帶來了更為直觀且全面的視角。盡管傳統(tǒng)的電子顯微鏡技術(shù)能夠獲取蛋白質(zhì)的三維靜態(tài)結(jié)構(gòu),但在解析諸如蛋白質(zhì)折疊這類快速且連續(xù)的動(dòng)態(tài)事件時(shí),受限于只能呈現(xiàn)某一時(shí)刻的快照,要完整重建整個(gè)折疊過程,理論上需要連續(xù)拍攝海量的高分辨率照片,可能多達(dá)數(shù)十億幀。即便如此,即使收集到了如此巨量的靜態(tài)影像數(shù)據(jù),也無法直接解讀出折疊過程中的細(xì)微動(dòng)態(tài)變化,特別是那些深藏于分子內(nèi)部、不易觀察到的微結(jié)構(gòu)轉(zhuǎn)變。另外,電子顯微鏡觀測過程中對(duì)樣品的物理擾動(dòng)也可能影響對(duì)蛋白質(zhì)真實(shí)動(dòng)態(tài)行為的準(zhǔn)確捕捉和理解。通過運(yùn)用分子動(dòng)力學(xué)模擬技術(shù),則能夠在一定程度上克服上述難題,助力藥物研發(fā)人員在理論層面上更加精確地預(yù)測和設(shè)計(jì)藥物分子與靶標(biāo)蛋白的相互作用。

此外,通過超算安騰進(jìn)行藥物研發(fā)也突破了通用超級(jí)計(jì)算機(jī)的計(jì)算效率。在安騰超級(jí)計(jì)算機(jī)出現(xiàn)之前,即使是最先進(jìn)的通用超級(jí)計(jì)算機(jī),盡管其峰值浮點(diǎn)運(yùn)算速度可達(dá)到每秒十億億次(petaflops),但在處理像分子動(dòng)力學(xué)模擬這樣的復(fù)雜任務(wù)時(shí),由于受到復(fù)雜算法的執(zhí)行瓶頸、海量數(shù)據(jù)處理壓力以及較低的計(jì)算效能制約,實(shí)際模擬效能顯得頗為有限。例如,一臺(tái)頂級(jí)的通用超級(jí)計(jì)算機(jī),在進(jìn)行分子動(dòng)力學(xué)模擬時(shí),每日可能僅能模擬出幾納秒至幾十納秒的分子運(yùn)動(dòng)過程。相比之下,生物體內(nèi)的自然過程,如蛋白質(zhì)折疊,其實(shí)際時(shí)間尺度通常在微秒級(jí)別以上,甚至可能達(dá)到毫秒級(jí)別?;谶@種時(shí)間尺度的差距,若僅依賴于傳統(tǒng)的計(jì)算資源來模擬一個(gè)完整的生物過程,例如從蛋白質(zhì)初始折疊直至達(dá)到穩(wěn)定狀態(tài)的全過程,理論上可能需要耗費(fèi)數(shù)年,甚至在極端情況下,可能需要幾十上百年的時(shí)間才能完成一個(gè)詳細(xì)的模擬研究。

安騰超級(jí)計(jì)算機(jī)的出現(xiàn),極大推動(dòng)了生物計(jì)算行業(yè)的發(fā)展。除了助推Relay的發(fā)展外,2020年3月27日,D. E. Shaw研究所宣布了一項(xiàng)針對(duì)新冠病毒的重大科研突破:他們成功運(yùn)用安騰超級(jí)計(jì)算機(jī)進(jìn)行了3CL蛋白酶長達(dá)100微秒的高精度分子動(dòng)力學(xué)模擬,并同步發(fā)布了模擬動(dòng)畫和數(shù)據(jù)資料。3CL蛋白酶作為新冠病毒繁殖與結(jié)構(gòu)裝配過程中的關(guān)鍵成分,以及新冠藥物研發(fā)的重點(diǎn)靶標(biāo)之一,其動(dòng)態(tài)行為的精確模擬為科研人員探究病毒生命周期的內(nèi)在運(yùn)作規(guī)律以及設(shè)計(jì)針對(duì)性極強(qiáng)的3CL蛋白酶抑制劑奠定了極其重要的理論基礎(chǔ)。

常規(guī)情況下,即便是采用國際領(lǐng)先的超級(jí)計(jì)算機(jī)集群,要實(shí)現(xiàn)相同級(jí)別的模擬實(shí)驗(yàn)所耗費(fèi)的時(shí)間可能會(huì)以年計(jì)。然而,得益于安騰超級(jí)計(jì)算機(jī)對(duì)分子動(dòng)力學(xué)計(jì)算任務(wù)的高度優(yōu)化能力,這項(xiàng)原本耗時(shí)冗長的任務(wù)在短短十幾天內(nèi)就被高效執(zhí)行完畢。隨后的兩年里,D. E. Shaw研究所持續(xù)推進(jìn)研究,陸續(xù)發(fā)布了累計(jì)超過1000微秒的新冠病毒分子動(dòng)力學(xué)模擬研究成果,這些成果對(duì)深化新冠病毒病理學(xué)理解以及驅(qū)動(dòng)相關(guān)治療藥物的研發(fā)工作產(chǎn)生了深遠(yuǎn)且持久的影響。

也許,在未來的AI制藥領(lǐng)域,依托類似安騰這樣的專用超級(jí)計(jì)算機(jī),AI制藥企業(yè)將得以在積極構(gòu)建和完善自家數(shù)據(jù)庫的同時(shí),也能并行開展一系列高度復(fù)雜的計(jì)算密集型研發(fā)活動(dòng)。通過這種雙軌并進(jìn)的方式,AI制藥公司有望在優(yōu)化藥品研發(fā)流程、大幅縮短創(chuàng)新周期上取得顯著成效,從而在科研突破和商業(yè)成功上取得傳統(tǒng)醫(yī)藥公司難以企及的成就。

本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:http://v.mrkbao.com/news/11120240509142640252546319.html

陳晨陳晨管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論