《生成式人工智能服務管理暫行辦法》正式施行,網(wǎng)易易盾專家對此進行解讀

生成式人工智能(Generative AI,以下簡稱“AIGC”)技術正在高速發(fā)展,并通過各種軟件、終端設備走進我們的生活和工作中,然而AIGC在為社會帶來便利的同時也帶來了相應的法律風險。國家網(wǎng)信辦等七部門發(fā)布了《生成式人工智能服務管理暫行辦法》(以下稱“辦法”),對生成式人工智能進行專項監(jiān)管,于2023年8月15日正式施行。在數(shù)據(jù)安全上,生成式人工智能提供者和使用者分別有哪些需要注意的風險、該采取哪些保護措施、又有怎樣的法律責任?

網(wǎng)易易盾安全專家將依據(jù)《辦法》對這幾方面進行分析解讀。

01.適用范圍

根據(jù)管理辦法第2條的規(guī)定:

利用生成式人工智能技術向中華人民共和國境內(nèi)公眾提供生成文本、圖片、音頻、視頻等內(nèi)容的服務,適用本辦法。

這意味著境外AIGC服務提供者(無論是模型層還是應用層),無論是直接向境內(nèi)提供相關服務,還是通過API接口或其他形式“封裝”后提供“間接”服務,都將受限于管理辦法的相關規(guī)定。

此次管理辦法引入了一項“安全港”例外,即“行業(yè)組織、企業(yè)、教育和科研機構(gòu)、公共文化機構(gòu)、有關專業(yè)機構(gòu)等研發(fā)、應用生成式人工智能技術,未向境內(nèi)公眾提供生成式人工智能服務的,不適用本辦法的規(guī)定”。因此,如果只是內(nèi)部研發(fā)或者使用相關技術,不對外提供服務,則只要獲得技術提供方的授權以及遵守網(wǎng)絡安全、數(shù)據(jù)和個人信息保護等相關法律法規(guī)的,是符合此次《辦法》的規(guī)定。這緩解了許多企業(yè)接入生成式人工智能服務用于改善工作效率等內(nèi)部應用的合規(guī)顧慮,體現(xiàn)了《辦法》審慎包容、鼓勵創(chuàng)新的監(jiān)管思路。

02.分類分級監(jiān)管規(guī)則

根據(jù)管理辦法第3條的規(guī)定:

對生成式人工智能服務實行包容審慎和分類分級監(jiān)管。

第十六條進一步規(guī)定:

國家有關主管部門針對生成式人工智能技術特點及其在有關行業(yè)和領域的服務應用,完善與創(chuàng)新發(fā)展相適應的科學監(jiān)管方式,制定相應的分類分級監(jiān)管規(guī)則或者指引。

雖然管理辦法并沒有進一步展開分級監(jiān)管的具體規(guī)則,但預計相關內(nèi)容會在即將出臺的《人工智能法》中做出規(guī)定。由于生成式人工智能具有通用性,“包容審慎和分級分類”的監(jiān)管思路有助于《辦法》作為生成式人工智能領域的“基本法”保留一定靈活性,各監(jiān)管部門、行業(yè)主管部門、標準化組織亦可以在此基礎上制定更加細化的生成式人工智能分級分類規(guī)則,并針對特定行業(yè)、特定應用或某些高風險的生成式人工智能服務制定更為嚴格的規(guī)范。

此外,《辦法》針對生成式人工智能服務一些主要的應用場景,規(guī)定利用生成式人工智能服務從事新聞出版、影視制作、文藝創(chuàng)作等活動需遵守相關領域的監(jiān)管規(guī)定,與現(xiàn)有制度對接。

03.算法及內(nèi)容安全的規(guī)定

根據(jù)管理辦法第4條的規(guī)定:

提供和使用生成式人工智能服務,應當遵守法律、行政法規(guī),尊重社會公德和倫理道德。

為了遵守法律法規(guī)和體現(xiàn)社會主義核心價值觀,對于實時交互內(nèi)容審核和利用AI生成內(nèi)容,需要加強敏感內(nèi)容審核,例如涉政、涉黃、涉暴等內(nèi)容,以確保信息的安全和合規(guī)性。然而,特殊的prompt指令可能會繞過AI自身的安全機制,增加審核的難度和復雜度。

《生成式人工智能服務管理暫行辦法》正式施行,網(wǎng)易易盾專家對此進行解讀

為了解決這個問題,網(wǎng)易易盾針對AIGC+UGC場景下的機器審核能力,可根據(jù)業(yè)務場景配置審核的松緊程度,選擇適當?shù)膶徍瞬呗詠頋M足不同場景的合規(guī)要求。

如在語聊對話場景中,存在真實用戶和智能機器人兩種角色,這要求機審能夠快速識別不良信息,確保人機聊天的實時性。AI機審技術可根據(jù)業(yè)務場景不同,在UGC內(nèi)容和AIGC生成內(nèi)容配置不同的松緊度審核策略,兼顧用戶使用體驗和內(nèi)容安全合規(guī)性。

在算法設計、訓練數(shù)據(jù)選擇、模型生成和優(yōu)化、提供服務等過程中,采取有效措施防止產(chǎn)生民族、信仰、國別、地域、性別、年齡、職業(yè)、健康等歧視。

《辦法》特別指出具有各類歧視的內(nèi)容,要采取有效防止措施。網(wǎng)易易盾安全專家分析,大模型在訓練、測試和生產(chǎn)過程中可能會遇到歧視內(nèi)容數(shù)據(jù)的風險,這些風險是由于訓練數(shù)據(jù)中存在偏差或缺失,導致模型在處理不同群體的個體數(shù)據(jù)時出現(xiàn)不公平或歧視性的結(jié)果。為了避免大型模型在生產(chǎn)中出現(xiàn)歧視風險,需要在訓練數(shù)據(jù)的收集和處理過程中考慮數(shù)據(jù)的平衡性和代表性,確保訓練數(shù)據(jù)充分涵蓋不同群體的數(shù)據(jù)分布和特征,避免對某些群體進行歧視或忽略。

《生成式人工智能服務管理暫行辦法》正式施行,網(wǎng)易易盾專家對此進行解讀

此外,還需要采用一系列的模型評估和監(jiān)控措施,及時發(fā)現(xiàn)和糾正模型中存在的歧視問題。這些措施包括但不限于公平性指標的設計、敏感性分析、模型的可解釋性、數(shù)據(jù)隱私保護等。這樣可以幫助確保大模型生成的結(jié)果是公正和合理的,避免歧視風險對特定群體造成負面影響。

04.服務提供者的義務

在征求意見稿中,AIGC服務提供者被要求承擔一項極其高的義務,即“保證數(shù)據(jù)的真實性、準確性、客觀性和多樣性”。考慮到AIGC技術開發(fā)的實際情況,管理辦法做出了合理化的修改,即“采取有效措施提高訓練數(shù)據(jù)質(zhì)量,增強訓練數(shù)據(jù)的真實性、準確性、客觀性、多樣性”。管理辦法亦不再強制要求服務提供者對用戶實行實名制。此外,征求意見稿曾要求服務提供者有義務在三個月內(nèi)通過模型優(yōu)化訓練等方式防止再次生成不當內(nèi)容,但考慮到AIGC產(chǎn)生不當內(nèi)容的天然潛在持續(xù)性和不確定性,管理辦法刪除了該義務,僅要求服務提供者及時優(yōu)化模型并向主管部門報告。最后,在處罰部分,刪除了“終止提供服務并處一萬元以上十萬元以下罰款”的規(guī)定。

不過,管理辦法亦增加了部分新的義務,比如服務提供者應與用戶簽訂服務協(xié)議明確雙方權利義務,對用戶違法活動的監(jiān)督增加了“警示”、“限制功能”以及“保存記錄”和“報告”的義務等。但該等新增義務均較為合理,不會顯著增加服務提供者的額外負擔。

05.安全評估和算法備案

征求意見稿曾無差別地要求AIGC服務提供者在對外提供服務前,按照《具有輿論屬性或社會動員能力的互聯(lián)網(wǎng)信息服務安全評估規(guī)定》向國家網(wǎng)信部門申報安全評估,并按照《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》履行算法備案手續(xù)。管理辦法做出了顯著的修改,明確只有“提供具有輿論屬性或者社會動員能力的生成式人工智能服務”的服務提供者,才需開展安全評估和算法備案。

雖然縮小了適用范圍,但管理辦法并沒有進一步明確“具有輿論屬性或者社會動員能力的生成式人工智能服務”的認定標準。從合理評估的角度來判斷,結(jié)合《具有輿論屬性或社會動員能力的互聯(lián)網(wǎng)信息服務安全評估規(guī)定》,新聞、社交、直播、教育、寫作、聊天等AIGC相關技術被認定的可能性比較高。

06.境外服務提供者

包括OpenAI在內(nèi)的AIGC行業(yè)的境外廠商,無疑處于技術領先地位,境外投資者在該領域也更為活躍。管理辦法首次原則性明確,“對來源于中華人民共和國境外向境內(nèi)提供生成式人工智能服務不符合法律、行政法規(guī)和本辦法規(guī)定的,國家網(wǎng)信部門應當通知有關機構(gòu)采取技術措施和其他必要措施予以處置。”結(jié)合上述第一條的適用范圍相關規(guī)定,對于“嵌套”、“封裝”境外AIGC技術的境內(nèi)服務提供者,將面臨底層境外技術支持隨時中斷的風險。

此外,管理辦法首次指出,“外商投資生成式人工智能服務,應當符合外商投資相關法律、行政法規(guī)的規(guī)定”??紤]到目前AIGC相關外商投資的規(guī)定尚不明確,建議持續(xù)關注相關立法動態(tài),且預計根據(jù)未來出臺的分類分級監(jiān)管規(guī)則,會適用不同的外商投資限制規(guī)定。

07.利好創(chuàng)新的政策措施

《辦法》針對生成式人工智能研發(fā)、應用提出了一系列政策鼓勵措施,包括:

· 鼓勵生成式人工智能技術在各行業(yè)、各領域的創(chuàng)新應用,生成積極健康、向上向善的優(yōu)質(zhì)內(nèi)容,探索優(yōu)化應用場景,構(gòu)建應用生態(tài)體系。

· 支持行業(yè)組織、企業(yè)、教育和科研機構(gòu)、公共文化機構(gòu)、有關專業(yè)機構(gòu)等在生成式人工智能技術創(chuàng)新、數(shù)據(jù)資源建設、轉(zhuǎn)化應用、風險防范等方面開展協(xié)作。

· 鼓勵生成式人工智能算法、框架、芯片及配套軟件平臺等基礎技術的自主創(chuàng)新,平等互利開展國際交流與合作,參與生成式人工智能相關國際規(guī)則制定。

· 推動生成式人工智能基礎設施和公共訓練數(shù)據(jù)資源平臺建設。推動公共數(shù)據(jù)分類分級有序開放,擴展高質(zhì)量的公共訓練數(shù)據(jù)資源。促進算力資源協(xié)同共享,提升算力資源利用效能(第5條、第6條)。

網(wǎng)易易盾安全專家表示,隨著《生成式人工智能服務管理暫行辦法》的落實,監(jiān)管體系逐漸完善,生成式人工智能行業(yè)即將迎來應用的爆發(fā),也進一步鼓勵生成式人工智能技術在各行業(yè)、各領域的創(chuàng)新應用。但是,企業(yè)在訓練數(shù)據(jù)合規(guī)性、生成內(nèi)容安全準確和可靠性、生成式人工智能服務的透明度等方面的要求,需要企業(yè)結(jié)合技術與法律力量提出可行性的解決方案,符合監(jiān)管機構(gòu)的安全規(guī)范要求,共同推進生成式人工智能應用生態(tài)發(fā)展。

原創(chuàng)文章,作者:陳晨,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/576969.html

陳晨陳晨管理團隊

相關推薦

發(fā)表回復

登錄后才能評論