7月12日,全球領先的人工智能小冰框架與Vsinger達成合作,探索虛擬歌手向AI being遷移的路徑,啟動了專為虛擬歌手洛天依定制的歌聲、語音多個AI聲庫的制作企劃,展示了由小冰深度神經網絡歌唱模型(Xiaoice DNN Singing Model)驅動的洛天依。
作為數字新物種,虛擬歌手正朝著人工智能驅動的AI being遷移。在洛天依十周年生日會直播現場,洛天依首次用AI發(fā)聲:“唱出你心中的歌,我是虛擬歌手洛天依?!辈⑼瑫r宣布,以小冰框架定制的洛天依AI,和X Studio音樂創(chuàng)作軟件制作企劃正式啟動,其中包括洛天依的歌聲合成聲庫,和第一個語音聲庫,將向廣大創(chuàng)作者們推出。
生日會口播視頻片段
與此同時,在為期一個半月的洛天依十周年線下展的現場,參觀者將體驗到基于人工智能小冰框架驅動的AI洛天依的歌聲,并能參與到內測版小冰X Studio音樂創(chuàng)作軟件與洛天依AI聲庫的測試中。未來,洛天依AI聲庫與X Studio正式上線后,將兼容MacOS和Windows平臺、支持多種唱法參數調節(jié)、AI一鍵調參等新功能,界面設計和交互體驗也更貼合專業(yè)用戶的習慣,這將讓基于洛天依IP的音樂創(chuàng)作,更加便利和順暢,也擁有更多聲音表現的可能性。
更好的體驗離不開技術創(chuàng)新。自2016年以來,小冰團隊以DNN為技術基礎,持續(xù)探索和拓寬人工智能歌唱的上限與邊界?;陔p方合作,小冰團隊率先在洛天依AI聲庫,通過優(yōu)化后的小樣本學習,就能夠完成音色融合、唱法遷移、高品質歌聲合成。優(yōu)化后的小樣本學習,是指新模型僅需25首歌曲作為訓練基數,就可以達到85%或MOS 4.25以上的聲音還原度;音色融合,是指在給定的音色基礎上,可更精細的構建聲庫和調參,創(chuàng)造出無數個質量相同,但音色不同的虛擬歌手;唱法遷移,是指將音頻中的音色和唱法信息分離,實現訓練好一種唱法模型,就可以快速遷移到任意虛擬歌手身上。這些技術創(chuàng)新,能讓小冰框架快速訓練出無限個各具特色的高品質虛擬歌手。
未來每個人身邊,都將環(huán)繞著許多個虛擬人。多年之后回望,小冰框架與Vsinger雙向奔赴的一小步,將是AI驅動的虛擬歌手,加速進入大眾日常生活的一大步。
原創(chuàng)文章,作者:蘋果派,如若轉載,請注明出處:http://2079x.cn/article/557448.html