10月21日,杭州云棲大會(huì)上,阿里巴巴達(dá)摩院發(fā)布軟硬件結(jié)合語(yǔ)音產(chǎn)品“聽(tīng)悟”。相比只能逐字轉(zhuǎn)寫(xiě)的上一代語(yǔ)音產(chǎn)品,“聽(tīng)悟”是面向未來(lái)會(huì)議的AI助理,集成了達(dá)摩院最新語(yǔ)音及自然語(yǔ)言處理技術(shù),不僅“聽(tīng)”得準(zhǔn),且“悟”性高,可秒速生成智能會(huì)議紀(jì)要及待辦。
會(huì)議場(chǎng)景對(duì)語(yǔ)音轉(zhuǎn)文字產(chǎn)品有強(qiáng)需求。但因技術(shù)限制,傳統(tǒng)語(yǔ)音產(chǎn)品存在“聽(tīng)不準(zhǔn)、分不清、看不懂”等問(wèn)題,往往在噪音下識(shí)別準(zhǔn)確率較低,無(wú)法區(qū)分不同說(shuō)話人,轉(zhuǎn)寫(xiě)內(nèi)容冗長(zhǎng)難以閱讀和沉淀。針對(duì)痛點(diǎn),達(dá)摩院語(yǔ)音實(shí)驗(yàn)室打造了“聽(tīng)悟”,通過(guò)讓AI深度參與,讓線上及線下會(huì)議更智能、高效、協(xié)同。
“聽(tīng)悟”內(nèi)置達(dá)摩院獨(dú)創(chuàng)聲紋融合方位算法,能對(duì)多達(dá)10位說(shuō)話人進(jìn)行角色分離;融入達(dá)摩院新一代端到端語(yǔ)音識(shí)別模型,中文識(shí)別準(zhǔn)確率可達(dá)98%,支持14種方言及中英文“自由說(shuō)”;可嵌入線上音視頻會(huì)議,實(shí)時(shí)出字幕及紀(jì)要。
除了聽(tīng)力好,這位AI助理悟性也高。 “聽(tīng)悟”能模仿人工整理,進(jìn)行智能糾錯(cuò)和分段,自動(dòng)過(guò)濾語(yǔ)氣詞,讓生成文本更流暢。同時(shí),“聽(tīng)悟”擅長(zhǎng)抓重點(diǎn),可秒速生成關(guān)鍵詞、核心結(jié)論、重點(diǎn)內(nèi)容和待辦,用戶能同屏編輯、標(biāo)注摘要、一鍵分享、安全保存?!奥?tīng)悟”還能對(duì)常用詞、用戶行為及歷史文檔進(jìn)行自學(xué)習(xí),越用越聰明。
此外,“聽(tīng)悟”配置了智能麥克風(fēng),融入達(dá)摩院指向性差分麥克風(fēng)陣列技術(shù),可實(shí)現(xiàn)7米內(nèi)遠(yuǎn)距離360度高清收音,相比傳統(tǒng)麥克風(fēng)收音距離、抗噪能力大為提升。
達(dá)摩院語(yǔ)音實(shí)驗(yàn)室負(fù)責(zé)人鄢志杰表示,“語(yǔ)音技術(shù)的發(fā)展是不斷解鎖場(chǎng)景的歷史,會(huì)議作為當(dāng)下組織協(xié)同的核心場(chǎng)景,是語(yǔ)音AI將變革的下一個(gè)重要場(chǎng)景。”
鄢志杰介紹,“聽(tīng)悟”適用于企業(yè)會(huì)議、金融調(diào)研、媒體訪談、教育培訓(xùn)等泛會(huì)議場(chǎng)景,目前面向企業(yè)客戶,已為多家頭部金融企業(yè)提供服務(wù),且應(yīng)用于釘釘新上線的“釘閃記”功能中。未來(lái),“聽(tīng)悟”還將探索與會(huì)議廠商合作。
IDC報(bào)告顯示,阿里AI近年在語(yǔ)音語(yǔ)義領(lǐng)域表現(xiàn)強(qiáng)勁,市場(chǎng)年增長(zhǎng)率達(dá)96.6%,增速第一,總營(yíng)收中國(guó)前二,已深入政務(wù)、金融、電商、法律等行業(yè),應(yīng)用于會(huì)議、客服、IoT、搜索、文本分析等場(chǎng)景。
原創(chuàng)文章,作者:蘋(píng)果派,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/539690.html