解碼「天工SkyMusic」，填補(bǔ)AI音樂領(lǐng)域技術(shù)空白

陳晨 ? 2024年4月12日 15:29:10 ? 產(chǎn)經(jīng)

這幾周，全球無不對AI音樂大模型那”以假亂真“的音樂創(chuàng)作能力感到驚奇不已，甚至有人認(rèn)為“AI將革新音樂產(chǎn)業(yè)”。

而位居這場革新風(fēng)暴中心的，正是昆侖萬維推出的國內(nèi)唯一公開可用的AI音樂生成大模型——「天工SkyMusic」。

自開啟邀測以來，「天工SkyMusic」已經(jīng)在互聯(lián)網(wǎng)上刷爆了存在感，成為網(wǎng)友們改編、二創(chuàng)音樂的新晉網(wǎng)紅神器。

遲遲等不到的“音樂ChatGPT”時(shí)刻

相信大家在體驗(yàn)「天工SkyMusic」時(shí)，都會有一個(gè)疑問：隔壁AI視頻生成大模型都開始輔助創(chuàng)作了，為什么「天工SkyMusic」這類AI音樂生成大模型才才嶄露頭角？

原因在于構(gòu)建生成高質(zhì)量音樂的AI大模型，所面臨的復(fù)雜度遠(yuǎn)超想象。

一方面是技術(shù)路線的選擇，AI音樂生成大模型有兩種主流技術(shù)路線，符號音樂生成和大模型音樂音頻生成。前者以MIDI為主要流派，其本身不包含音頻文件，而是記錄音樂演奏的指令，比如哪個(gè)音符被播放、音量是多少、音符持續(xù)的時(shí)間等，不能生成直接聽的音樂。

學(xué)術(shù)與產(chǎn)業(yè)界在符號派的AI音樂生成上投入了大量研究，但是始終效果不佳。

相反，深度學(xué)習(xí)大規(guī)模音頻數(shù)據(jù)則通過大模型端對端的方案，直接生成包含樂器、人聲、旋律等音樂元素的完整音頻作品。它需要模型具備極高的模擬精確度、大規(guī)模的高品質(zhì)音頻數(shù)據(jù)集、龐大的算力支撐……

這是一條預(yù)期效果更好，但是難度非常高的技術(shù)路徑，業(yè)內(nèi)只有很少玩家展開研究。

同時(shí)，鑒于歌聲在音樂審美中的核心地位，AI對人聲歌唱逼真模擬的研究也尤為關(guān)鍵。遺憾的是，受限于技術(shù)發(fā)展，以往AI音樂生成模型更關(guān)注無人聲演唱的背景音樂（Background Music，BGM）領(lǐng)域，而非包含人聲演唱的Song領(lǐng)域，因此行業(yè)內(nèi)缺乏有效的解決方案。

因此在AI音樂生成領(lǐng)域，無論是OpenAI的JukeBox、Meta的MusicGen，還是Google的MusicLM，它們雖然逐步解決了AI音樂生成中的痛點(diǎn)，但距離生成高品質(zhì)且類型豐富的音樂作品還有一定距離。

「天工SkyMusic」自研發(fā)階段即確立目標(biāo)，要開發(fā)一款輔助用戶創(chuàng)作高質(zhì)量音樂的工具。團(tuán)隊(duì)毅然選擇了AI音樂生成大模型的道路，并決定重點(diǎn)攻克人聲歌唱難題，勇敢涉足AI音樂制作領(lǐng)域內(nèi)兩個(gè)最具挑戰(zhàn)的無人區(qū)。

「天工SkyMusic」架構(gòu)誕生記

面對大模型音樂音頻生成+人聲Song這兩個(gè)近乎空白的技術(shù)領(lǐng)域，昆侖萬維傾注了海量研發(fā)資源和算力算法投入，不斷試錯(cuò)，終于自主研發(fā)出一套音樂音頻領(lǐng)域的大模型架構(gòu)。

解碼「天工SkyMusic」，填補(bǔ)AI音樂領(lǐng)域技術(shù)空白

這是一套類似Sora的DiT大模型架構(gòu)，采用LLM+Diffusion的核心模塊組成。

其中，用戶輸入的參考音樂會被拆解為不同的Music Patches，由Large-scale Transformer負(fù)責(zé)譜曲，來學(xué)習(xí)Music Patches的上下文依賴關(guān)系，同時(shí)完成音樂可控性。

同時(shí)，Diffusion Transformer將負(fù)責(zé)大模型的“演唱”部分，通過LDM（Latent Diffusion Model）擴(kuò)散模型讓Music Patches被還原成成44.1KHz的高品質(zhì)立體聲的音頻。

昆侖萬維這套高效、靈活且具有情感表達(dá)能力的音樂生成模型架構(gòu)，填補(bǔ)了音頻生成+人聲Song這兩技術(shù)領(lǐng)域的空白，堪稱AI音樂生成領(lǐng)域的一大技術(shù)飛躍，也讓昆侖萬維公開「天工SkyMusic」技術(shù)原理圖的舉措更讓人敬佩，它不僅打破了行業(yè)內(nèi)的封閉狀態(tài)，更為更是為整個(gè)產(chǎn)業(yè)鋪墊了一條可復(fù)現(xiàn)的技術(shù)路徑，大大降低整個(gè)AI音樂生成產(chǎn)業(yè)的研發(fā)風(fēng)險(xiǎn)。

AI音樂破曉：「天工SkyMusic」的中國式突破

從「天工SkyMusic」的技術(shù)分析中我們可以看到，昆侖萬維在研發(fā)過程中克服了諸多技術(shù)難題，為我們打造出一個(gè)真正意義上，能高效創(chuàng)作高品質(zhì)音樂的AI音樂生成大模型。在這里，我們可以生成時(shí)長80秒，采樣率44.1KHz的雙聲道立體聲歌曲，還可以通過歌詞控制歌曲的情緒變化，精確區(qū)分不同音樂結(jié)構(gòu)間的情感起伏，也可完成各種復(fù)雜歌唱技巧。

而且較之國外同類產(chǎn)品，「天工SkyMusic」最明顯的差異是在中文人聲歌唱上發(fā)音純正清晰，無明顯機(jī)械痕跡，效果逼真的程度足以“以假亂真”。這不僅讓中文歌詞韻味和情感表達(dá)更為出色，也在表達(dá)中國文化特有的意境與情感內(nèi)涵時(shí)，更加貼合國人的審美習(xí)慣與情感認(rèn)同，形成獨(dú)有的差異化優(yōu)勢。

情感AGI待放：天工SkyMusic」引領(lǐng)情感創(chuàng)作變革

「天工SkyMusic」作為昆侖萬維 “All in AGI和AIGC”戰(zhàn)略下在音樂領(lǐng)域的先鋒之作，填補(bǔ)了傳統(tǒng)AGI側(cè)重于智力拓展而忽視情感維度的空白，標(biāo)志著昆侖萬維在情感AGI研究中取得的重大突破。

如今，「天工SkyMusic」不僅降低音樂創(chuàng)作門檻，讓更多普通用戶能夠借助這款全民音樂創(chuàng)作工具的力量，更好地通過音樂這一媒介，表達(dá)自己的情感和創(chuàng)意。未來，隨著昆侖萬維在情感AGI技術(shù)上不斷的突破，「天工SkyMusic」將具備更多令人驚嘆的創(chuàng)作能力，亦有望成為輔助專業(yè)音樂創(chuàng)作者的利器。

本文轉(zhuǎn)載自：，不代表科技訊之立場。原文鏈接：http://show.wolaioa.com.cn/preview/E3JtFBKZw36o000ofZ6KfH6Ahg.html

陳晨管理團(tuán)隊(duì)

0 0

產(chǎn)經(jīng)

深圳市統(tǒng)一政務(wù)服務(wù)App i深圳已上架HarmonyOS NEXT應(yīng)用市場

隨著華為HarmonyOS NEXT的正式發(fā)布及更多機(jī)型的公測啟動，鴻蒙生態(tài)系統(tǒng)迎來了又一重要里程碑。截至目前，鴻蒙原生應(yīng)用及元服務(wù)數(shù)量超過15000個(gè)，有的伙伴和開發(fā)者甚至以一天…

陳晨
12小時(shí)前
產(chǎn)經(jīng)

樂橙舉辦2024秋季新品發(fā)布會，新品極境X10系列實(shí)現(xiàn)AI智能門鎖新突破

10月23日，樂橙以一場盛大的秋季新品發(fā)布會，再次憑實(shí)力將大眾視線吸引到“智能門鎖”上。此次發(fā)布會，樂橙不僅推出年度重磅新品極境X10，還首發(fā)展示其自研的領(lǐng)先算法“瓴洞視覺系統(tǒng)”，…

陳晨
12小時(shí)前
產(chǎn)經(jīng)

高通驍龍8至尊版亮相：性能領(lǐng)先A18 Pro達(dá)到40%，更有多項(xiàng)首發(fā)

北京時(shí)間10月22日凌晨，2024驍龍峰會上，高通正式發(fā)布新一代驍龍旗艦移動平臺——驍龍8至尊版(驍龍8?Elite)。　　再次改變產(chǎn)品命名方式也在“意料之中”，畢竟…

陳晨
12小時(shí)前
瓜分15萬獎金池，「第6屆天池全球數(shù)據(jù)庫大賽」火熱報(bào)名中

日前，“第6屆天池全球數(shù)據(jù)庫大賽”在阿里云天池官網(wǎng)正式開賽。據(jù)悉，本屆大賽由阿里云與英特爾聯(lián)合主辦，阿里云瑤池?cái)?shù)據(jù)庫、阿里云天池平臺和開發(fā)者社區(qū)承辦，現(xiàn)已面向全球開發(fā)者開放報(bào)名邀約…

陳晨
產(chǎn)經(jīng) 13小時(shí)前
產(chǎn)經(jīng)

戴森設(shè)計(jì)大獎國際20強(qiáng)名單出爐

首次有兩支中國大陸賽區(qū)團(tuán)隊(duì)同時(shí)入選，腦卒中康復(fù)問題成為矚目焦點(diǎn) 近日，2024年戴森設(shè)計(jì)大獎國際20強(qiáng)公布，中國年輕一代發(fā)明者再次名列其中。中國大陸賽區(qū)首次有兩支團(tuán)隊(duì)挺進(jìn)國際20強(qiáng)…

陳晨
13小時(shí)前
徐州移動“四聚四力”，助推國企黨建提質(zhì)增效

中國移動江蘇公司徐州分公司（以下簡稱：徐州移動）以習(xí)近平新時(shí)代中國特色社會主義思想為統(tǒng)領(lǐng)，從“聚魂、聚情、聚能、聚力”四個(gè)維度入手，切實(shí)提升黨建工作的引領(lǐng)力、感召力、凝聚力和推動力…

陳晨
產(chǎn)經(jīng) 13小時(shí)前
產(chǎn)經(jīng)

《黑神話：悟空》成最大贏家，高刷電視成游戲體驗(yàn)飆升的秘訣！

在不久前結(jié)束的2024年泰國游戲大展上，《黑神話：悟空》可謂大放異彩，斬獲了多個(gè)獎項(xiàng)。作為當(dāng)下最為熱門的國產(chǎn)3A大作，它成功走出國門，在全球游戲舞臺展現(xiàn)出獨(dú)特的魅力，身為忠實(shí)粉絲的…

陳晨
13小時(shí)前
三星Galaxy Tab S9系列：你的雙11平板電腦新選擇！

宛如歲末星河初綻，11.11如期而至。身處這場專為甄選精品而設(shè)的璀璨盛典，眾多廣受贊譽(yù)的臻品如星辰競相閃耀，為每個(gè)追求品質(zhì)生活與卓越人生的用戶帶來入手心儀好物的良機(jī)。例如代表著現(xiàn)代…

陳晨
產(chǎn)經(jīng) 15小時(shí)前
產(chǎn)經(jīng)

RTX 加速AI 創(chuàng)作，開啟AI 商業(yè)設(shè)計(jì)速度革命！

10月18日,由NVIDIA Studio、七彩虹、火星時(shí)代教育聯(lián)合舉辦的RTX AI創(chuàng)作座談及1小時(shí)極限創(chuàng)作挑戰(zhàn)活動在火星時(shí)代教育北京總部舉行?！禔I設(shè)計(jì)商業(yè)化落地的實(shí)際應(yīng)用》交…

陳晨
15小時(shí)前
產(chǎn)經(jīng)

DECODE Global在FXVC品牌發(fā)布會上達(dá)成戰(zhàn)略

廈門，2024年10月20日 —— 作為外匯和差價(jià)合約（CFD）交易領(lǐng)域的領(lǐng)導(dǎo)者，DECODE Global通過在10月19日于廈門舉辦的FXVC品牌發(fā)布會上進(jìn)行戰(zhàn)略，進(jìn)一步鞏固了…

陳晨
15小時(shí)前
徐州移動強(qiáng)化警企聯(lián)動持續(xù)推進(jìn)斷卡防詐工作

徐州移動持續(xù)強(qiáng)化源頭治理，依靠AI模型和大數(shù)據(jù)技術(shù)，與公安機(jī)關(guān)密切協(xié)同配合，穩(wěn)步推進(jìn)系列防詐反詐措施，成效顯著。提升反詐處置能力。在全市警企聯(lián)動的斷卡行動中，徐州移動與徐州市公安…

陳晨
產(chǎn)經(jīng) 15小時(shí)前
產(chǎn)經(jīng)

博為光電：引領(lǐng)汽車空調(diào)及新能源汽車熱管理技術(shù)新篇章

2024第22屆上海國際車用空調(diào)及熱管理技術(shù)展覽會于10月21-23日在上海新國際博覽中心盛大開幕。此次展覽面積近4萬平方米，吸引了全球650多家參展商。該展會歷史悠久，見證了中國…

陳晨
15小時(shí)前
徐州移動推進(jìn)智慧農(nóng)業(yè)發(fā)展助力科技興農(nóng)

江蘇淮海番茄品質(zhì)育種(徐州研發(fā)中心)項(xiàng)目是徐州銅山區(qū)重點(diǎn)打造的一個(gè)以番茄高品質(zhì)新品種育、繁、推一體化為主營業(yè)務(wù)的科技現(xiàn)代農(nóng)業(yè)項(xiàng)目。在互聯(lián)網(wǎng)高速發(fā)展的時(shí)期，當(dāng)農(nóng)業(yè)遇上互聯(lián)網(wǎng)，會是怎樣…

陳晨
產(chǎn)經(jīng) 16小時(shí)前
產(chǎn)經(jīng)

1024程序員節(jié)致敬鴻蒙開發(fā)者：共碼未來，奔赴“山花爛漫”

10月24日，在程序員節(jié)到來之際，華為舉辦以“共碼未來，待到山花爛漫時(shí)”為主題的致敬鴻蒙開發(fā)者專屬活動，攜手科技UP主探訪了嗶哩嗶哩、貝殼、航旅縱橫、京東、麥當(dāng)勞、美團(tuán)、去哪兒、瑞…

陳晨
16小時(shí)前
徐州移動向“新”而行，譜寫數(shù)智發(fā)展新篇章

中國移動江蘇公司徐州分公司（以下簡稱：徐州移動）牢記“央企姓黨”政治屬性，秉持紅色通信初心使命，充分發(fā)揮自身信息化優(yōu)勢，發(fā)力信息基礎(chǔ)設(shè)施建設(shè)，探索信息技術(shù)融合創(chuàng)新，切實(shí)服務(wù)經(jīng)濟(jì)社會…

陳晨
產(chǎn)經(jīng) 16小時(shí)前
產(chǎn)經(jīng)

鴻蒙團(tuán)隊(duì)1024程序員節(jié)致敬開發(fā)者：同心協(xié)力，共碼未來

在10月22日舉辦的原生鴻蒙之夜暨華為全場景新品發(fā)布會上，華為常務(wù)董事、終端BG董事長、智能汽車解決方案BU董事長余承東公布了鴻蒙生態(tài)的最新進(jìn)展：“HarmonyOS已成為最具生命…

陳晨
16小時(shí)前
徐州移動與徐工基礎(chǔ)攜手共建5G專網(wǎng)開啟智能制造新篇章

近日，徐州移動與徐工基礎(chǔ)達(dá)成戰(zhàn)略合作，攜手共建5G專網(wǎng)，標(biāo)志著雙方在推動智能制造、履行央企社會責(zé)任方面邁出了堅(jiān)實(shí)的一步。這一舉措不僅為智能制造注入了強(qiáng)勁動力，更彰顯了雙方在科技創(chuàng)新…

陳晨
產(chǎn)經(jīng) 16小時(shí)前
產(chǎn)經(jīng)

1024程序員節(jié)致敬鴻蒙開發(fā)者：鴻蒙生態(tài)一日千里的幕后英雄

在2024年的10月24日程序員節(jié)，華為舉辦以“共碼未來，待到山花爛漫時(shí)”為主題的致敬鴻蒙開發(fā)者專屬活動，向那些為鴻蒙生態(tài)持續(xù)貢獻(xiàn)力量的開發(fā)者們致以崇高的敬意。十年鑄…

陳晨
16小時(shí)前
重拳“打貓”再出擊！徐州移動助力警方打掉電詐窩點(diǎn)

近日，徐州移動協(xié)助徐州市公安局反詐騙中心破獲一起境外分子利用向日葵軟件遠(yuǎn)程操控國內(nèi)固話實(shí)施詐騙的案件，成功搗毀電信網(wǎng)絡(luò)詐騙窩點(diǎn)1處，有效打擊了境外分子的詐騙氣焰，避免了人民群眾的財(cái)…

陳晨
產(chǎn)經(jīng) 16小時(shí)前
產(chǎn)經(jīng)

國產(chǎn)操作系統(tǒng)助力深圳地鐵五線齊發(fā)，創(chuàng)新軌道交通安全底座

10月8日，深圳地鐵集團(tuán)黨委副書記、總經(jīng)理黃力平做客深圳廣電集團(tuán)《民心橋》節(jié)目時(shí)透露，今年將有5條地鐵線陸續(xù)開通運(yùn)營！軌道交通，是一座城市的“超級血管”。在深圳這座繁忙又充滿活力…

陳晨
16小時(shí)前