AI能寫文章、能畫畫、能聊天,這些已經(jīng)不再新鮮。但你是否想過,AI還能能聽見危險的聲音、能讓課堂更生動,甚至能能用方言朗誦古詩?
在2024年12月29日晚,中央廣播電視總臺首屆《中國科技創(chuàng)新盛典》(簡稱“科晚”)上,科大訊飛董事長劉慶峰用一系列精彩的現(xiàn)場演示,向全國觀眾展現(xiàn)了人工智能賦能千行百業(yè)的創(chuàng)新實踐,看AI技術(shù)如何真正走進百姓生活、服務(wù)社會發(fā)展。
作為中央廣播電視總臺繼“春晚”后打造的又一檔重點節(jié)目,此次科技跨年盛典以“新質(zhì)生產(chǎn)力”為主題,全面展現(xiàn)2024年中國科技創(chuàng)新的重大成果??拼笥嶏w作為人工智能企業(yè)代表在盛典現(xiàn)場展示其最新的人工智能技術(shù)應(yīng)用成果。
”AI張騰岳“三分鐘炫技3種方言
當(dāng)舞臺上突然出現(xiàn)“第二個張騰岳”時,現(xiàn)場觀眾發(fā)出陣陣驚嘆。這位由訊飛智作打造的 AI 虛擬數(shù)字人,不僅與真人主持人神態(tài)自若地互動對話,更帶來了一場跨越語言與方言的精彩表演。
圖為“AI張騰岳”(左)與主持人張騰岳(右)同臺
“AI 虛擬數(shù)字人張騰岳”用陜西、粵語、河南地方言分別演繹《靜夜思》《望月懷遠(yuǎn)》《滿江紅》等經(jīng)典詩詞,字正腔圓,韻味十足,展現(xiàn)了AI驅(qū)動的虛擬數(shù)字人技術(shù)在多語言多方言表達(dá)方面取得的突破性進展。
圖為“AI張騰岳”用陜西方言朗誦《靜夜思》
據(jù)介紹,AI張騰岳融合了科大訊飛先進的語音合成、語音識別、語義理解、唇形預(yù)測、圖像處理等人工智能技術(shù),通過深度學(xué)習(xí)實現(xiàn)表情、動作的精準(zhǔn)還原,配合先進的語音合成技術(shù),使 AI 張騰岳具備自然的表情、流暢的動作和真實的聲音表現(xiàn)。
在今年的科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛率先發(fā)布了超擬人數(shù)字人,僅需一張照片就能打造專屬形象口型、表情、動作均由大模型自動生成,能夠精準(zhǔn)匹配文本的意圖,進一步降低了虛擬數(shù)字人的應(yīng)用門檻,這些技術(shù)都可以在訊飛智作體驗。
當(dāng)前,訊飛智作的視頻配音、新聞視頻、培訓(xùn)視頻、廣告視頻也已經(jīng)廣泛應(yīng)用于媒體、金融、智慧文旅、企業(yè)數(shù)字化、智慧政務(wù)、IP運營多個領(lǐng)域,并與學(xué)習(xí)強國、新華社、WAIC、中信銀行、中國平安等單位建立合作。
虛擬數(shù)字人助力多場景賦能
當(dāng)下,技術(shù)進步帶來的普惠紅利正在逐步顯現(xiàn)。虛擬數(shù)字人開始解鎖越來越多的行業(yè)應(yīng)用場景。
訊飛多場景虛擬數(shù)字人+大模型賦能多個領(lǐng)域,從國際賽事巴黎奧運會到非遺文化北京中軸線,從行業(yè)活動天津智博會到智慧展廳山東高速,虛擬數(shù)字人正在扮演著越來越重要的角色。它們不僅能夠進行產(chǎn)品介紹和客戶服務(wù),還能夠基于大數(shù)據(jù)和人工智能技術(shù)提供更加精準(zhǔn)、個性化的服務(wù)體驗。當(dāng)前以AI虛擬人交互平臺為代表的平臺化產(chǎn)品,已在央國企(企業(yè)數(shù)字化)、教育培訓(xùn)、文化旅游、電子商務(wù)、金融服務(wù)等多個行業(yè)領(lǐng)域內(nèi)成功落地,其應(yīng)用的廣度與深度均在持續(xù)拓展之中。這一成就,正是訊飛虛擬數(shù)字人深入產(chǎn)業(yè)實踐的一個生動寫照。
圖為國家體育總局局長、中國奧委會主席高志丹等參觀“中國之家”由訊飛智作打造的AI虛擬人
作為新質(zhì)生產(chǎn)力代表,虛擬人平臺始終堅持踐行人工智能+,致力于讓虛擬人成為人類伙伴!
本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:http://news.cnmtpt.com/?Sid=11183474_M8394786264