騰訊AI又創(chuàng)新紀(jì)錄:ACL 2020入選27篇論文

近日,國際計算語言學(xué)協(xié)會年會(ACL,The Association for Computational

Linguistics)在官網(wǎng)公布了ACL 2020的論文收錄名單,共計收錄779篇論文。

近日,國際計算語言學(xué)協(xié)會年會(ACL,The Association for Computational

Linguistics)在官網(wǎng)公布了ACL 2020的論文收錄名單,共計收錄779篇論文。據(jù)不完全統(tǒng)計,此次騰訊共有27篇論文入選,投中論文總數(shù)刷新國內(nèi)記錄,領(lǐng)跑國內(nèi)業(yè)界AI研究第一梯隊。

本年度騰訊ACL入選論文中,有20篇來自騰訊AI Lab團(tuán)隊,7篇來自微信AI團(tuán)隊,研究方向涵蓋對話及文本生成、機(jī)器翻譯及文本理解、信息抽取、無監(jiān)督文本等多個NLP重點領(lǐng)域。

在過去一年,通過開源協(xié)同,騰訊梳理拉通了各個事業(yè)群最底層和共性的技術(shù)能力,加強(qiáng)了基礎(chǔ)研發(fā)投入,進(jìn)一步提升了研發(fā)效能和技術(shù)資源的利用效率,為AI技術(shù)的研發(fā)創(chuàng)新提供了更有生命力的土壤。

ACL是自然語言處理領(lǐng)域的國際頂級學(xué)術(shù)會議,也是自然語言處理領(lǐng)域影響力最大、最具活力的國際學(xué)術(shù)組織之一,論文被錄用代表著研究成果獲得了國際學(xué)術(shù)界的認(rèn)可。此次ACL 2020的審稿周期相比以往幾乎增加了一倍的時間,據(jù)最新公布數(shù)據(jù)顯示,本屆大會最終收到投稿論文3088篇,投稿數(shù)量創(chuàng)下新高。

騰訊AI又創(chuàng)新紀(jì)錄:ACL 2020入選27篇論文

技術(shù)實力強(qiáng)勁,AI基礎(chǔ)研究優(yōu)勢突出

近年來,騰訊在AI基礎(chǔ)研究方面持續(xù)投入,致力于打造面向未來的技術(shù)引擎。騰訊AI團(tuán)隊在ACL 2019入選國內(nèi)首篇最佳長論文,在ICML、CVPR、NeurIPS、ACL等多個頂級學(xué)術(shù)會議或期刊累計入選論文超過285篇,并在DSTC 8等多項競賽奪冠,展現(xiàn)了業(yè)界領(lǐng)先的研究能力與技術(shù)實力。

自然語言處理是騰訊 AI Lab 的重要研究方向之一,研究內(nèi)容囊括了從自然語言理解到生成的整個鏈條。2019年,騰訊AI Lab在人機(jī)對話與文本生成方面,提出多種對話生成新框架,發(fā)布了多個對話數(shù)據(jù)集,同時還改進(jìn)了開放域?qū)υ捪到y(tǒng)。在機(jī)器翻譯研究方面,騰訊AI Lab探索了主流翻譯模型中的自注意力模型改進(jìn)和篇章翻譯,并嘗試打開神經(jīng)網(wǎng)絡(luò)翻譯模型的黑盒子,解釋其中核心問題的運行機(jī)制。

微信AI團(tuán)隊也長期深耕對自然語言處理領(lǐng)域人工智能技術(shù)的研發(fā),擁有微信智言與微信智聆等領(lǐng)先的NLP技術(shù)產(chǎn)品,其入選ACL 2020 的7篇論文,涉及了機(jī)器翻譯、對話系統(tǒng)、信息抽取、無監(jiān)督文本生成等領(lǐng)域。2019年,微信AI團(tuán)隊?wèi){借NumNet+模型,超越谷歌獲得DROP閱讀理解榜單第一名。

應(yīng)用場景豐富,面向行業(yè)開放技術(shù)能力

頂尖的產(chǎn)品背后離不開頂尖的技術(shù)。騰訊豐富的業(yè)務(wù)場景、龐大的用戶基數(shù),都為前沿的AI研究成果提供了最佳的“訓(xùn)練場”。在此基礎(chǔ)上,騰訊也將充分打磨的技術(shù)能力通過騰訊云以產(chǎn)品和服務(wù)的形式面向金融、政務(wù)、醫(yī)療、交通、教育等各行業(yè)開放,為眾多客戶和合作伙伴提供底層技術(shù)支撐,助力產(chǎn)業(yè)互聯(lián)網(wǎng)進(jìn)入快車道。

目前,微信 AI 團(tuán)隊推出了“微信智聆”和“微信智言”兩大技術(shù)能力品牌,分別關(guān)注語音和語義。微信智聆每天處理超過 4 億條語音,識別準(zhǔn)確率為 97%,服務(wù)于騰訊內(nèi)外超過 100 項業(yè)務(wù)。微信智言專注于智能對話和自然語言處理,目前已經(jīng)支持家居硬件、PaaS、行業(yè)云和AI Bot等應(yīng)用領(lǐng)域。

微信AI團(tuán)隊還將技術(shù)的精進(jìn)不斷用于產(chǎn)品功能,研發(fā)了語音輸入轉(zhuǎn)文字、掃一掃的掃碼 / 封面和翻譯、聊天機(jī)器人、搖一搖 – 音樂 / 電視、聲紋鎖等功能,并為王者榮耀、QQ 音樂等產(chǎn)品提供技術(shù)支持。

在2020年初的微信公開課PRO版上,微信AI宣布開放以硬件合作為核心的騰訊小微硬件開放平臺、以對話開放能力為核心的微信對話開放平臺和NLP基礎(chǔ)技術(shù)平臺,全面開放各層次 NLP 能力,面向行業(yè)用戶及開發(fā)者,開放微信前沿的NLP研究成果。

騰訊 AI Lab則在2018年11月推出了TranSmart產(chǎn)品,采用業(yè)內(nèi)領(lǐng)先的人機(jī)交互式機(jī)器翻譯技術(shù),幫助用戶更好更快地完成翻譯任務(wù)。

今年4月,騰訊AI Lab研發(fā)的自然語言理解系統(tǒng)TexSmart也對外開放,提供細(xì)粒度命名實體識別、語義聯(lián)想、深度語義表達(dá)等特色功能。TexSmart是騰訊公司級文本處理工具的功能加強(qiáng)版,為自然語言處理相關(guān)的騰訊業(yè)務(wù)及產(chǎn)品提供廣泛支持,日調(diào)用量達(dá)數(shù)千億次。

除了產(chǎn)品和技術(shù)能力的開放,騰訊還致力于通過開源與開發(fā)者共享代碼,目前開源項目總數(shù)已破百。

僅在AI領(lǐng)域,騰訊已開源Angel、NCNN等數(shù)十個優(yōu)質(zhì)項目。針對業(yè)界現(xiàn)有的中文詞向量公開數(shù)據(jù)的稀缺和不足,騰訊AI Lab開源了大規(guī)模、高質(zhì)量的中文詞向量數(shù)據(jù),包含了800多萬中文詞匯,相比現(xiàn)有的公開數(shù)據(jù),在覆蓋率、新鮮度及準(zhǔn)確性上均有大幅提高,為對話回復(fù)質(zhì)量預(yù)測和醫(yī)療實體識別等自然語言處理方向的業(yè)務(wù)應(yīng)用帶來顯著的效能提升。

原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/495903.html

若安丶的頭像若安丶管理團(tuán)隊

相關(guān)推薦