IEEE ICDM 2023數(shù)據(jù)挖掘研究頂會落幕，網(wǎng)易易盾獨占鰲頭

陳晨 ? 2023年12月29日 17:19:29 ? 產(chǎn)經(jīng)

近日,IEEE ICDM 2023圖學(xué)習(xí)挑戰(zhàn)賽決賽圓滿落幕。本次比賽由螞蟻集團與浙江大學(xué)聯(lián)合主辦,旨在通過深度圖學(xué)習(xí),解決社區(qū)發(fā)現(xiàn)和團伙挖掘等風(fēng)險問題。

歷時4個多月,經(jīng)過初賽、復(fù)賽、決賽“三級賽制”的角逐和專家評選,網(wǎng)易易盾數(shù)據(jù)挖掘團隊在該項任務(wù)中,以綜合指標(biāo)第一名的成績擊敗來自海內(nèi)外的數(shù)十支隊伍,在Adjusted Rand Score(ARI)評價指標(biāo)上達到0.5006,大幅領(lǐng)先第二(0.425)/三名(0.368)對手, 并于技術(shù)答辯階段憑借方法創(chuàng)新性、工業(yè)應(yīng)用價值等方面的優(yōu)異表現(xiàn),斬獲大賽唯一一項一等獎。

IEEE ICDM(IEEE International Conference on Data Mining)是全球領(lǐng)先的數(shù)據(jù)挖掘研究會議之一,與ACM SIGKDD和SIAM SDM同列為數(shù)據(jù)挖掘領(lǐng)域的三大頂級國際會議。ICDM提供了一個展示原創(chuàng)研究成果的平臺,研究范圍橫跨數(shù)據(jù)挖掘與人工智能領(lǐng)域,包括算法、軟件、系統(tǒng)和應(yīng)用程序等,吸引了大量來自相關(guān)領(lǐng)域的研究人員和應(yīng)用程序開發(fā)人員參會。

“社區(qū)發(fā)現(xiàn)”與“團伙挖掘”

本次賽題主題“社區(qū)發(fā)現(xiàn)”是網(wǎng)絡(luò)科學(xué)領(lǐng)域的一個重要問題,其主要目標(biāo)是將給定的圖網(wǎng)絡(luò)劃分成若干個互相連接、內(nèi)部聯(lián)系緊密的社區(qū),從而揭示網(wǎng)絡(luò)中存在的隱藏結(jié)構(gòu)和模式。圖學(xué)習(xí)有助于改進社區(qū)發(fā)現(xiàn)的效果。

社區(qū)發(fā)現(xiàn)在社交網(wǎng)絡(luò)分析、生物信息、風(fēng)控、推薦等領(lǐng)域有著廣泛的應(yīng)用,例如在風(fēng)控場景中,將相似用戶劃分為社區(qū)有利于黑產(chǎn)追蹤。但是在實際業(yè)務(wù)中,黑產(chǎn)追蹤和團伙挖掘任務(wù)經(jīng)常面臨缺乏大量的標(biāo)記數(shù)據(jù)的困難,因此社區(qū)發(fā)現(xiàn)方法變得尤為重要。

當(dāng)今社交網(wǎng)絡(luò)和互聯(lián)網(wǎng)的快速發(fā)展,使得網(wǎng)絡(luò)中的節(jié)點數(shù)量和連接關(guān)系快速增長,這也導(dǎo)致了社區(qū)發(fā)現(xiàn)和團伙挖掘問題變得更加復(fù)雜和具有挑戰(zhàn)性。在這種背景下,深度圖學(xué)習(xí)開始被應(yīng)用于社區(qū)發(fā)現(xiàn)和團伙挖掘,它能夠自動學(xué)習(xí)網(wǎng)絡(luò)中的高級表征,從而提高社區(qū)發(fā)現(xiàn)和團伙挖掘的效果。

將預(yù)訓(xùn)練模型應(yīng)用于社區(qū)發(fā)現(xiàn)和團伙挖掘是一個相對較新穎且具有挑戰(zhàn)性的問題。該任務(wù)的難度較大,需要更多的深入探索和研究。為了激勵研究者在這個領(lǐng)域使用預(yù)訓(xùn)練模型相關(guān)技術(shù),本次比賽提供了一個平臺,旨在鼓勵參賽者探索預(yù)訓(xùn)練模型在社區(qū)發(fā)現(xiàn)和團伙挖掘中的應(yīng)用潛力。

“團伙挖掘”與“數(shù)字內(nèi)容風(fēng)控”

在本屆競賽中,網(wǎng)易易盾深入研究了關(guān)系圖譜中的社區(qū)向量化技術(shù),并首創(chuàng)一種頗具實用價值的欺詐團伙檢測算法——Risk-DCRN,通過社區(qū)預(yù)劃分和社區(qū)向量化兩階段管道方法,實現(xiàn)了大規(guī)模圖網(wǎng)絡(luò)上稀疏標(biāo)簽數(shù)據(jù)條件下欺詐用戶群體的高效精準(zhǔn)識別。

區(qū)別于業(yè)界對于該問題場景的常規(guī)解決方式,該方法的contribution主要體現(xiàn)在針對真人作弊場景的絕佳適配,當(dāng)“人機識別”被“真人”挑戰(zhàn)時,因欺詐者與正常用戶的行為邊界模糊,業(yè)界所使用的圖深度學(xué)習(xí)向量化算法普遍存在表征塌陷問題,導(dǎo)致樣本Embedding傾向于映射至同一特征子空間內(nèi),限制了節(jié)點表征向量的區(qū)分能力,從而影響了最終的網(wǎng)絡(luò)聚類性能。

為此,易盾數(shù)據(jù)挖掘團隊針對該垂類場景,精心設(shè)計了一種基于對偶相關(guān)性衰減網(wǎng)絡(luò)(Dual Correlation Reduction Netework,DCRN)的稠密子圖自監(jiān)督深度圖聚類框架(如下圖所示),應(yīng)用于從社區(qū)預(yù)劃分結(jié)果中進一步通過稠密風(fēng)險子圖向量的相似性聚類,最終準(zhǔn)確挖掘出潛藏于龐大關(guān)系網(wǎng)中的346個欺詐團伙。

該框架包含2大模塊:

一、Graph-Distortion:類似于在NLP領(lǐng)域研究者通過會隨機mask掉一定比例字符,網(wǎng)易易盾根據(jù)相似性矩陣值小于0.1將其置0來構(gòu)造掩碼矩陣,使得模型從節(jié)點的不同上下文鄰居中學(xué)習(xí)到更豐富的特征表達。

二、DICR(Dual Information Correlation Reduction):從樣本及特征視角都考慮了相關(guān)性的降低,這樣可以過濾冗余信息,在潛在空間中保留更明顯的特征,從而學(xué)習(xí)到高區(qū)分度的表征,避免崩潰,提高聚類性能。

本屆大賽重點聚焦于業(yè)務(wù)安全領(lǐng)域中最經(jīng)典的團伙檢測問題,恰好與網(wǎng)易易盾當(dāng)前深耕的業(yè)務(wù)方向緊密契合。目前,大規(guī)模圖深度學(xué)習(xí)及社區(qū)發(fā)現(xiàn)等前沿創(chuàng)新技術(shù)正在助力網(wǎng)易易盾智能風(fēng)控開辟新的商業(yè)化增值空間,并于游戲、社交娛樂等行業(yè)均實現(xiàn)了技術(shù)成果業(yè)務(wù)轉(zhuǎn)化,屢破游戲外掛工作室、社交引流詐騙團伙等群體作案風(fēng)險,在客戶服務(wù)層面取得了眾多成功實踐。網(wǎng)易易盾以體系化的數(shù)字內(nèi)容風(fēng)控技術(shù)為客戶提供實現(xiàn)長效運營的基礎(chǔ)安全保障。

這也是近半年來,網(wǎng)易易盾數(shù)據(jù)挖掘團隊繼AIWIN、數(shù)博會等權(quán)威賽事獲獎后,再次摘得國際研究頂級會議主辦的大數(shù)據(jù)與AI結(jié)合的競賽冠軍。

未來的浪潮是AI,AI的底層是大數(shù)據(jù)。網(wǎng)易易盾正在用一項又一項扎實的研究成果夯實AI技術(shù)在數(shù)字內(nèi)容風(fēng)控行業(yè)的創(chuàng)新應(yīng)用,以為客戶創(chuàng)造更高價值。

原創(chuàng)文章，作者：陳晨，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/613571.html

陳晨管理團隊

0 0

產(chǎn)經(jīng)

加速文旅、娛樂行業(yè)數(shù)字化發(fā)展，PICO 正式推出XR大空間內(nèi)容運營解決方案

近年來，線下沉浸娛樂行業(yè)迎來了新一波熱潮。伴隨這股風(fēng)潮，許多線下文旅景區(qū)、文博場館、商超運營者們，開始爭相打造自己的內(nèi)容IP，開發(fā)各類大空間XR內(nèi)容來打造虛擬體驗，借助沉浸式線下X…

陳晨
21小時前
產(chǎn)經(jīng)

安吉爾37周年感恩回饋季，全天候直播開啟福利大派送

今年是安吉爾成立37周年，在周年慶之際，安吉爾開啟感恩回饋季，以一系列活動回饋廣大消費者。據(jù)了解，在10月26日，安吉爾將在抖音“安吉爾福利官”直播間和天貓官方旗艦店雙平臺同步開啟…

陳晨
21小時前
2024科大訊飛全球1024開發(fā)者節(jié)，AI文娛論壇亮點紛呈

10月24日，2024科大訊飛全球1024開發(fā)者節(jié)AI文娛論壇在合肥圓滿舉辦。論壇以“重構(gòu)內(nèi)容與表達”為主題，旨在探討AI時代下文娛產(chǎn)業(yè)的最新趨勢，見證訊飛AI文娛業(yè)務(wù)的重大發(fā)布，…

陳晨
產(chǎn)經(jīng) 21小時前
產(chǎn)經(jīng)

安吉爾攜三大場景凈水解決方案，亮相新加坡國際食品與酒店展覽會

10月22日至25日，新加坡國際食品與酒店展覽會（FHA HoReCa 2024）成功舉辦。FHA HoReCa是亞太地區(qū)最大的餐飲、酒店和食品服務(wù)行業(yè)展會之一，為餐飲和酒店行業(yè)的…

陳晨
21小時前
產(chǎn)經(jīng)

易慧智能發(fā)布汽車行業(yè)大模型評測集，并重磅推出模型路由技術(shù)方案

10月25日，汽車行業(yè)AI產(chǎn)品和業(yè)務(wù)解決方案提供商易慧智能發(fā)布了汽車行業(yè)首個大模型評測集。此次評測旨在全面評估市面上主流大模型在汽車行業(yè)中的實際應(yīng)用效果，特別關(guān)注于汽車營銷場景的應(yīng)…

陳晨
21小時前
產(chǎn)經(jīng)

訊飛星火與華為數(shù)據(jù)存儲強強聯(lián)手，“以存強算” 助力AI集群算力利用率飆升30%

在風(fēng)云變幻的AI大模型時代，科大訊飛與華為的聯(lián)合拓展令人印象深刻。過去幾年來，雙方協(xié)同創(chuàng)新突破重重障礙，一次次證明國產(chǎn)算力基礎(chǔ)設(shè)施可以支撐國產(chǎn)AI大模型良性發(fā)展，在關(guān)鍵性能和體驗上…

陳晨
1天前
產(chǎn)經(jīng)

MagicOS 9.0發(fā)布，榮耀互聯(lián)網(wǎng)服務(wù)革新AI體驗

2024年10月23-24日，以“見證AI魔法”為主題的榮耀MagicOS 9.0發(fā)布會及開發(fā)者大會（HGDC.2024）在北京中關(guān)村國際創(chuàng)新中心舉辦。作為行業(yè)首個搭載跨應(yīng)用開放生…

陳晨
1天前
產(chǎn)經(jīng)

抖音電商雙11開門紅｜差異化作者生態(tài)成就好內(nèi)容、促成好銷量

雙11熱度逐漸升溫，漸入高潮。為何今年雙11各大電商平臺集體搶跑，國慶假期一結(jié)束便立刻進入緊張的雙11籌備階段。電商競爭走向深水區(qū)，電商行業(yè)格局也邁進嶄新的階段。一、直播電商，…

陳晨
1天前
科脈驚艷亮相第十六屆中國商業(yè)信息化行業(yè)大會

當(dāng)下，在數(shù)字化和AI技術(shù)的落地應(yīng)用推動中，零售行業(yè)的格局正在以前所未有的速度被顛覆、被重塑。如何借助這股技術(shù)浪潮，對傳統(tǒng)管理、經(jīng)營及商業(yè)模式進行創(chuàng)新重塑，提升企業(yè)生命力與核心競爭力…

陳晨
產(chǎn)經(jīng) 1天前
JetBrains 面向非商業(yè)用途免費提供 WebStorm 和 Rider

領(lǐng)先的專業(yè)軟件開發(fā)工具創(chuàng)造者 JetBrains 宣布為 WebStorm（JavaScript 和 TypeScript IDE）以及 Rider（跨平臺 .…

陳晨
產(chǎn)經(jīng) 1天前
產(chǎn)經(jīng)

技嘉科技宣布 AORUS Z890 主板正式上市

AI D5黑科技2.0技術(shù)全面釋放強勁性能全球電腦品牌技嘉科技（GIGABYTE）宣布 AORUS Z890 系列主板現(xiàn)已正式開賣。該系列主板專為釋放新一代 Intel? Cor…

陳晨
1天前
標(biāo)準(zhǔn)融合賦能芯片開發(fā)測試：加特蘭獲2024第六屆金輯獎最佳技術(shù)實踐應(yīng)用獎

10月24日，第十二屆汽車與環(huán)境創(chuàng)新論壇暨第六屆金輯獎中國汽車新供應(yīng)百強頒獎盛典在上海召開。加特蘭微電子軟件研發(fā)負(fù)責(zé)人鄭珉楠應(yīng)邀出席，并就“標(biāo)準(zhǔn)協(xié)同——助力汽車芯片高效開發(fā)與測試”…

陳晨
產(chǎn)經(jīng) 1天前
產(chǎn)經(jīng)

問界新M7再迎升級，HUAWEI ADS 3.0帶來開新車的超凡體驗

進入秋季，汽車市場迎來了傳統(tǒng)的銷售旺季，各大品牌紛紛使出渾身解數(shù)，以爭搶市場份額。其中，問界新M7系列的市場表現(xiàn)尤為出色，截止10月20日，今年累計銷量已超過16.45萬輛，在眾多…

陳晨
1天前
產(chǎn)經(jīng)

10月31日，迪麗熱巴空降德施曼品牌直播間，暢聊居家生活美學(xué)

10月31日晚8點30分,德施曼智能鎖代言人迪麗熱巴,將空降德施曼官方直播間,與德施曼董事長/CEO祝志凌一起暢聊現(xiàn)代智能家居生活的無限可能,分享關(guān)于居家安全與儀式感的獨到見解。屆…

陳晨
1天前
產(chǎn)經(jīng)

2024驍龍峰會：自研Oryon CPU登陸手機、汽車丨驍龍8至尊版、驍龍至尊版汽車平臺

10月22日，高通舉行了2024驍龍峰會，正式推出了全新旗艦移動平臺——驍龍8至尊版。　　不只是全新命名那么簡單，驍龍8至尊版配備了下一代定制高通Oryon CPU，在Adren…

陳晨
1天前
高通史詩級驍龍上線，安蒙說時代變了，AI First的未來，是所有App都是“王牌應(yīng)用”

　　從“無線通信公司”轉(zhuǎn)型為面向新一代AI處理時代的“連接計算公司”，在過去很長一段時間以來，都是高通標(biāo)榜自身的主基調(diào)，而今年在夏威夷茂宜島如期舉行的驍龍峰會，話題正是從這一基調(diào)展…

陳晨
產(chǎn)經(jīng) 1天前
補齊拼圖后，高通終于猛推“三端歸一”

當(dāng)?shù)貢r間10月20日下午，記者抵達美國夏威夷茂宜島，參加10月21日開啟的高通驍龍峰會。在峰會的前兩個主題日，高通在智能手機和汽車平臺拿出了三款驍龍Elite(至尊版)新品。其中最…

陳晨
產(chǎn)經(jīng) 1天前
產(chǎn)經(jīng)

國家能源集團攜手?？低曆邪l(fā)攻克融合光譜煤質(zhì)快檢技術(shù)

首次實現(xiàn)新型煤質(zhì)快檢技術(shù)在煤炭全產(chǎn)業(yè)鏈?zhǔn)痉稇?yīng)用打造“在線測量+數(shù)字監(jiān)管”煤質(zhì)管控新模式。 10月24日上午10點，在國家能源集團準(zhǔn)能集團黑岱溝露天煤礦，安裝于準(zhǔn)能選煤廠…

陳晨
1天前
官宣！中國移動云盤純血鴻蒙版上線

10月22日，華為正式發(fā)布了全新HarmonyOS NEXT。作為華為鴻蒙生態(tài)的先鋒力量，中國移動云盤早在HarmonyOS NEXT內(nèi)測階段就已率先完成原生應(yīng)用核心版本的開發(fā)，同…

陳晨
產(chǎn)經(jīng) 1天前
跑分達308萬，Oryon CPU很能打！高通驍龍8至尊版性能實測

現(xiàn)在高通新一代旗艦移動平臺——驍龍8至尊版(驍龍8?Elite)已經(jīng)發(fā)布，作為首款集成高通定制Oryon?CPU的旗艦移動平臺，其CPU、GPU以及AI性能均有大幅提升。　　簡單…

陳晨
產(chǎn)經(jīng) 1天前

發(fā)表回復(fù)

登錄后才能評論

IEEE ICDM 2023數(shù)據(jù)挖掘研究頂會落幕，網(wǎng)易易盾獨占鰲頭

相關(guān)推薦

發(fā)表回復(fù)