專注數(shù)字內(nèi)容風(fēng)控,網(wǎng)易易盾安全大模型正式亮相


7月6日,以“智見未來,護航AI”為主題的2024網(wǎng)易易盾AI數(shù)字內(nèi)容風(fēng)控大會在杭州順利舉行。會上,網(wǎng)易數(shù)智旗下網(wǎng)易易盾正式發(fā)布面向數(shù)字內(nèi)容風(fēng)控領(lǐng)域的安全大模型。

“安全是一個需要抬頭創(chuàng)新、低頭深耕的行業(yè)。數(shù)字內(nèi)容風(fēng)控這個網(wǎng)絡(luò)安全領(lǐng)域內(nèi)的細(xì)分賽道正在蓬勃發(fā)展,這次安全大模型的發(fā)布是我們多年來技術(shù)和經(jīng)驗沉淀的‘集大成時刻’?!本W(wǎng)易數(shù)智副總經(jīng)理、網(wǎng)易易盾總經(jīng)理朱浩齊在大會上帶來網(wǎng)易易盾自研安全大模型的首次正式亮相。

專注數(shù)字內(nèi)容風(fēng)控,網(wǎng)易易盾安全大模型正式亮相

七年磨一劍:為安全范式轉(zhuǎn)變做準(zhǔn)備

在社會學(xué)著作《理解媒介》中,思想家麥克盧漢曾深刻、具體地揭示了媒介的影響力。

按照麥克盧漢的理論,媒介信息在很大程度上影響人間事物的尺度變化和模式變化,塑造人的組合方式和形態(tài)。因此,媒體是導(dǎo)致社會變動的最強大力量之一。從報紙到電視廣播,再到網(wǎng)絡(luò)傳媒與數(shù)字時代的新媒體,作為信息和內(nèi)容的載體,媒介方式隨著技術(shù)變革在不斷進化。與此同時,麥克盧漢的理論在逐步得到證實。

數(shù)字內(nèi)容的安全問題不僅沒有隨著技術(shù)進步消除,相反,對社會的影響正在逐年上升。

“我們在經(jīng)歷一場底層安全范式的轉(zhuǎn)變。信息傳播技術(shù)的進步把內(nèi)容安全問題的重要性升級了,需求端從原先的附加安全發(fā)生了到內(nèi)生安全這一模式轉(zhuǎn)變。作為服務(wù)者,我們不僅需要從理論、技術(shù)和工具上做準(zhǔn)備,更需要從思維上主動擁抱變革?!敝旌讫R在大會上說。

如今,人工智能技術(shù)的發(fā)展與應(yīng)用極大地提升了內(nèi)容生產(chǎn)的效率和質(zhì)量。通過自然語言處理(NLP)、機器學(xué)習(xí)、圖像識別等技術(shù),人工智能可以幫助企業(yè)自動化地生成文章、視頻、圖像等內(nèi)容,甚至進行個性化推薦和優(yōu)化,滿足用戶的多樣化需求。誠然,AIGC為企業(yè)與社會帶來內(nèi)容生產(chǎn)力的成倍增長,但也再次放大數(shù)字內(nèi)容安全的重要性。

從最開始服務(wù)于網(wǎng)易內(nèi)部業(yè)務(wù)的安全部門到服務(wù)外部客戶的完全商業(yè)化品牌,網(wǎng)易易盾既有天然的技術(shù)優(yōu)勢,又有豐富的的場景實踐經(jīng)驗。

同時,多年內(nèi)外部客戶的持續(xù)服務(wù)也讓網(wǎng)易易盾擁有了成熟的技術(shù)、產(chǎn)品與服務(wù)體系。網(wǎng)易易盾面向娛樂社交、游戲、電商、金融、零售、政企等多個行業(yè)相繼推出了解決方案,同時秉持“助力客戶內(nèi)生成長”的服務(wù)理念,持續(xù)上線AIGC內(nèi)容安全、出海安全合規(guī)、未成年人網(wǎng)絡(luò)保護等數(shù)十個場景化安全方案。

7年多的時間,網(wǎng)易易盾累計數(shù)據(jù)檢測量超3萬億,覆蓋終端數(shù)超32億,服務(wù)客戶審核效率提升超10倍。

專注數(shù)字內(nèi)容風(fēng)控,網(wǎng)易易盾安全大模型正式亮相

網(wǎng)易易盾既是數(shù)字內(nèi)容風(fēng)控領(lǐng)域的頭部企業(yè),又是AI時代的先行者。率先參與到從附加安全到內(nèi)生安全的轉(zhuǎn)變,并以AI技術(shù)為安全業(yè)務(wù)賦能,給客戶提供更加專業(yè)的安全產(chǎn)品和服務(wù),進而推動行業(yè)發(fā)展——這在網(wǎng)易易盾總經(jīng)理朱浩齊看來,是義不容辭的責(zé)任,也是得天獨厚的市場先機。

因此,更懂?dāng)?shù)字內(nèi)容風(fēng)控的安全大模型正式發(fā)布了。

安全大模型:聚焦數(shù)字內(nèi)容風(fēng)控

在數(shù)字內(nèi)容安全問題治理的過程中,過去很長一段時間,更多的是憑借經(jīng)驗。

在抖音上這句話能不能發(fā)?在小紅書上這個問題能不能搜到?在微博這個話題是否可以討論?然而落到個體對每次具體情況的理解不同,最終體現(xiàn)在安全風(fēng)控措施的理解上也非常不同。

在網(wǎng)易易盾成立的初期,曾有過一次深入的討論:我們能不能基于我們對各行業(yè)實際落地的經(jīng)驗,去建立各行業(yè)內(nèi)容風(fēng)控的標(biāo)準(zhǔn)?而在實際落地過程中,發(fā)現(xiàn)標(biāo)準(zhǔn)仍還是非常的粗糙,與以往并沒有根本性不同。

大模型的興起和應(yīng)用,使網(wǎng)易易盾這個想法真正具備可行性。早在2021年,網(wǎng)易易盾就開始著手研究大模型相關(guān)技術(shù),通過讓大模型學(xué)習(xí)理解不同場景下,不同內(nèi)容的評判結(jié)果,讓人工智能去建立各行各業(yè)、各個場景中內(nèi)容風(fēng)控的研判標(biāo)準(zhǔn),進而完成數(shù)字內(nèi)容的精細(xì)化治理。

在這樣復(fù)雜的特定場景中,通用大模型顯然并不能提供符合需求的最優(yōu)解。

“數(shù)字內(nèi)容風(fēng)控是安全服務(wù)。安全,就要一絲一毫都不能差。我們給客戶提供的必須是我們自己都挑不出問題的完美方案?!敝旌讫R講述了帶領(lǐng)團隊開發(fā)安全垂直大模型時的原則和思路。

在大模型的“軍備競賽”中,網(wǎng)易易盾雖然有“行業(yè)領(lǐng)軍者”的自我要求,卻不急于將不夠完美的產(chǎn)品推向客戶?;谧陨順I(yè)務(wù)的特性,從客戶的需求和實際應(yīng)用場景出發(fā),再到小心翼翼地驗證產(chǎn)品的每一個功能細(xì)節(jié),直到反復(fù)確認(rèn)沒有問題,可以解決客戶的問題——網(wǎng)易易盾的大模型之路走的每一步都是穩(wěn)字當(dāng)先。

專注數(shù)字內(nèi)容風(fēng)控,網(wǎng)易易盾安全大模型正式亮相

應(yīng)用安全大模型的數(shù)字內(nèi)容風(fēng)控通過大模型對風(fēng)控尺度的理解,對風(fēng)險內(nèi)容實現(xiàn)標(biāo)簽的自動、精準(zhǔn)標(biāo)識,提升人工審核效率。目前,基于各種場景的測試情況,網(wǎng)易易盾安全大模型已經(jīng)做到對部分色情疑難樣本召回提升30%以上,助力廣告對抗場景下的違法廣告識別率達到97%以上,AIGC人臉風(fēng)格化疑難案例的識別率超90%。此外,該安全大模型將風(fēng)險對抗的時效提升到了小時級,并且輔助真人引流團伙檢出量增長達3倍。

同時,在結(jié)合了網(wǎng)易易盾安全大模型的通用大模型問答場景中,基于安全大模型對用戶輸入的語義理解和對風(fēng)控規(guī)則的理解,能夠幫助各類通用大模型對于一些“看上去不好答”的題目,給予準(zhǔn)確的回答。除少數(shù)幾個極度敏感的議題外,幫助提供開放式問答的模型能夠快速做到“應(yīng)答盡答”。

以“?!敝巍澳!保篈I時代的長遠(yuǎn)藍(lán)圖

生成式人工智能的發(fā)展始終伴隨著對安全的質(zhì)疑。

自ChatGPT引爆人工智能浪潮熱點后,世界各國紛紛緊急將生成式人工智能的安全管控上升至重要緊急議題。我國為了促進生成式人工智能健康發(fā)展和規(guī)范應(yīng)用,發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,歐盟理事會批準(zhǔn)全球首部對人工智能進行全面監(jiān)管的《人工智能法案》,美國發(fā)布一項名為關(guān)于安全、可靠和值得信賴的人工智能(AI)的相關(guān)行政令。

綜合世界各國政府部門與頂級智庫對于人工智能安全問題的判斷來看,大模型時代的安全面臨突出的問題在于數(shù)據(jù)安全、內(nèi)容安全,其中包括業(yè)務(wù)安全、供應(yīng)鏈安全、合規(guī)以及道德倫理風(fēng)險。

其中,在當(dāng)下以及未來很長一段時間內(nèi),內(nèi)容安全問題會一直是人工智能治理的關(guān)鍵挑戰(zhàn)。社會需要關(guān)注的是大模型生成,如AI換臉的虛假違規(guī)內(nèi)容被利用為作惡工具,以及幻覺問題、知識模糊、不實新聞等。

專注數(shù)字內(nèi)容風(fēng)控,網(wǎng)易易盾安全大模型正式亮相

“對人工智能的治理,長期來看,也許需要靠另一個人工智能了?!敝旌讫R表達了對AI時代內(nèi)容安全問題治理趨勢的判斷,“人工智能給數(shù)字內(nèi)容生產(chǎn)和傳播效率帶來的是幾何倍數(shù)級別的增長,對于安全治理的能力提升要求自然也只有人工智能才能滿足?!?/p>

安全,不是一朝一夕的事情。尤其是全新技術(shù)帶來的既有“已知的未知”安全問題,也有“未知的未知”安全問題。為了解決各種“已知的未知”和“未知的未知”安全問題,網(wǎng)易易盾在大模型的研發(fā)思路中應(yīng)用了新設(shè)計的防御理論:內(nèi)生的彈性縱深防御體系。這個體系中有兩個最重要的設(shè)計原則:

一是用時間換精度。這個原則中考慮的并非某個時間點下系統(tǒng)的靜態(tài)防御能力,而是需要評估在持續(xù)的攻擊之下系統(tǒng)的自我升級能力,其稱之為“自免疫力”。

二是用不確定性提升防御強度。在測試數(shù)據(jù)變化的情況下,該原則要求通過提升自我保護能力實現(xiàn)系統(tǒng)對多次攻擊的穩(wěn)定防御。

用大模型治理大模型的數(shù)字內(nèi)容安全,用人工智能對抗人工智能帶來的安全風(fēng)險。這是網(wǎng)易易盾對未來趨勢的判斷,也是網(wǎng)易易盾正在走的安全技術(shù)長征。

本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:http://show.wolaioa.com.cn/preview/n3oRnAtLqWyL2Fv02bLgpg.html

陳晨陳晨管理團隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論