隨著對(duì)AI應(yīng)用的探索日趨深入,當(dāng)前的公開(kāi)數(shù)據(jù)在大模型訓(xùn)練進(jìn)程中漸趨枯竭,而“數(shù)據(jù)煙囪”又對(duì)高質(zhì)量數(shù)據(jù)流通使用形成了阻礙,數(shù)據(jù)要素的價(jià)值釋放成為AI產(chǎn)業(yè)向前發(fā)展過(guò)程中繞不開(kāi)的話(huà)題。9月起,國(guó)家數(shù)據(jù)局接連出臺(tái)政策,點(diǎn)明公共數(shù)據(jù)開(kāi)發(fā)利用是產(chǎn)業(yè)大勢(shì),并出臺(tái)“可信數(shù)據(jù)空間”建設(shè)計(jì)劃,目標(biāo)于2028年前建成100個(gè)可信數(shù)據(jù)空間,培育五類(lèi)空間、突破九項(xiàng)關(guān)鍵技術(shù)。
北京電子數(shù)智科技有限責(zé)任公司(以下簡(jiǎn)稱(chēng)“北電數(shù)智”)精準(zhǔn)洞察數(shù)據(jù)要素價(jià)值,憑借全棧AI能力投身“可信數(shù)據(jù)空間”實(shí)踐,加速產(chǎn)品落地,助力人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展。
在12月19日的2024 數(shù)據(jù)資產(chǎn)管理大會(huì)上,北電數(shù)智攜手北京大學(xué)信息管理系、中日友好醫(yī)院聯(lián)合編寫(xiě)的《智能計(jì)算驅(qū)動(dòng)的AI可信數(shù)據(jù)空間方案研究》(簡(jiǎn)稱(chēng)《研究報(bào)告》)正式發(fā)布北電數(shù)智憑借其在可信數(shù)據(jù)空間的深厚實(shí)踐,于《研究報(bào)告》中圍繞可信數(shù)據(jù)空間定義、案例、國(guó)內(nèi)發(fā)展現(xiàn)狀等維度,為智能計(jì)算驅(qū)動(dòng)的AI可信數(shù)據(jù)空間建設(shè)提出三層建議:
明確價(jià)值
可信數(shù)據(jù)空間是數(shù)據(jù)要素流通基建,也是全行業(yè)數(shù)據(jù)流通的關(guān)鍵保障,可借助隱私計(jì)算、虛擬沙箱等技術(shù)保障流通安全高效。具體展現(xiàn)為:以“數(shù)字合約”規(guī)范流通規(guī)則,提升效率;用可控、可追溯鏈路保護(hù)數(shù)據(jù)安全;靠分布式架構(gòu)讓數(shù)據(jù)由持有方保管,確保數(shù)據(jù)產(chǎn)權(quán)不轉(zhuǎn)移。
借鑒經(jīng)驗(yàn)
目前國(guó)內(nèi)外已有不少可信數(shù)據(jù)空間案例。歐盟構(gòu)建多層次可信數(shù)據(jù)空間體系,在科研、健康等領(lǐng)域成效斐然。例如:歐洲開(kāi)放科學(xué)云(EOSC)匯聚豐富的科研數(shù)據(jù)資源,助力科研創(chuàng)新。同時(shí),放眼國(guó)內(nèi)的政務(wù)、跨境、工業(yè)等領(lǐng)域,也有諸多實(shí)踐。例如:政務(wù)數(shù)據(jù)空間領(lǐng)域的“區(qū)塊鏈+審判”應(yīng)用可提效司法、跨境數(shù)據(jù)空間可促進(jìn)科研數(shù)據(jù)與實(shí)驗(yàn)裝置共享、工業(yè)數(shù)據(jù)空間可助力制造升級(jí)。
精準(zhǔn)施策
我國(guó)可信數(shù)據(jù)空間起步不久,“大模型+數(shù)據(jù)空間”因技術(shù)難、成本高,導(dǎo)致應(yīng)用案例相對(duì)稀缺。要推動(dòng)發(fā)展,需統(tǒng)一技術(shù)路線(xiàn)與標(biāo)準(zhǔn),解決二者結(jié)合問(wèn)題?!堆芯繄?bào)告》提議國(guó)資企業(yè)可帶頭打造安全高效公平的流通環(huán)境發(fā)揮領(lǐng)頭效應(yīng)和示范作用。
身為肩負(fù)“建設(shè)數(shù)字中國(guó)”使命的AI原生國(guó)企,北電數(shù)智秉持?jǐn)?shù)據(jù)要素領(lǐng)域前沿理念,全力打造安全可靠的數(shù)據(jù)交互、共享環(huán)境,搭建了“紅湖?可信數(shù)據(jù)空間”。一方面,為大模型開(kāi)發(fā)輸送優(yōu)質(zhì)數(shù)據(jù),借大模型產(chǎn)業(yè)撬動(dòng)數(shù)據(jù)要素價(jià)值;另一方面,該空間整體架構(gòu)貼合大模型開(kāi)發(fā)需求,面向數(shù)據(jù)提供方,以使用策略協(xié)商等功能護(hù)其權(quán)益,確保數(shù)據(jù)“可用不可見(jiàn)、可用不可存、可控可計(jì)量”。面向開(kāi)發(fā)者,紅湖·可信數(shù)據(jù)空間還提供了大模型嵌入與開(kāi)發(fā)、數(shù)據(jù)安全計(jì)算、流程管控、算力調(diào)度等能力,助力模型訓(xùn)練。
北電數(shù)智紅湖?可信數(shù)據(jù)空間的設(shè)計(jì)嚴(yán)守算法安全,依托混元算力構(gòu)建,通過(guò)嵌入機(jī)密計(jì)算能力、隱私計(jì)算軟硬一體設(shè)計(jì)等技術(shù)建設(shè)可信數(shù)據(jù)空間。在算法開(kāi)發(fā)時(shí),紅湖?可信數(shù)據(jù)空間提供了大模型開(kāi)發(fā)算法融入數(shù)據(jù)空間的標(biāo)準(zhǔn)化路徑,以此護(hù)航數(shù)據(jù)隱私。
在保障數(shù)據(jù)流通的安全性上,紅湖?可信數(shù)據(jù)空間同樣極具針對(duì)性。面對(duì)不同應(yīng)用場(chǎng)景下的數(shù)據(jù)特性,它采取差異化安全技術(shù)策略。倘若遇到數(shù)據(jù)量大、關(guān)聯(lián)超大模型且敏感度低的數(shù)據(jù),就運(yùn)用策略控制與軟件隔離手段,讓大模型訓(xùn)練安全、高效地推進(jìn);要是碰到多方來(lái)源、數(shù)據(jù)量小卻敏感度高的數(shù)據(jù),便啟用基于密碼學(xué)密文計(jì)算的樣本對(duì)齊、模型推理等技術(shù),全方位確保數(shù)據(jù)流通與使用過(guò)程中的安全無(wú)虞。
目前,北電數(shù)智已面向多行業(yè)打造可信數(shù)據(jù)空間系列方案,如:醫(yī)療領(lǐng)域整合異構(gòu)數(shù)據(jù)、挖掘AI數(shù)據(jù),訓(xùn)練專(zhuān)病垂類(lèi)大模型并打造面向診療等場(chǎng)景智能體;科研領(lǐng)域推出“1+1+N”科研數(shù)據(jù)服務(wù)解決方案,構(gòu)建科研與產(chǎn)品服務(wù)生態(tài)網(wǎng)絡(luò);公共數(shù)據(jù)運(yùn)營(yíng)領(lǐng)域貫通數(shù)據(jù)全鏈條,釋放公共數(shù)據(jù)價(jià)值賦能區(qū)域和相關(guān)產(chǎn)業(yè)鏈。
展望未來(lái),北電數(shù)智將繼續(xù)深耕可信數(shù)據(jù)空間領(lǐng)域,依托自身強(qiáng)大的技術(shù)研發(fā)實(shí)力與敏銳的行業(yè)洞察力,持續(xù)鍛造“紅湖·可信數(shù)據(jù)空間”產(chǎn)品服務(wù)能力,將更多創(chuàng)新方案推廣至更廣泛的領(lǐng)域,讓數(shù)據(jù)要素在安全有序的環(huán)境中充分流動(dòng),助力我國(guó)人工智能產(chǎn)業(yè)及數(shù)字經(jīng)濟(jì)邁向更高峰。
想獲取更多前沿資訊與深度內(nèi)容?快來(lái)“北電數(shù)智AI江湖”小程序一探究竟。
本文轉(zhuǎn)載自:,不代表科技訊之立場(chǎng)。原文鏈接:http://v.mrkbao.com/news/11120241224114521681141835.html