Meta 將涂鴉變動(dòng)畫的AI項(xiàng)目對(duì)外開源

該公司希望通過將動(dòng)畫繪圖作為開源項(xiàng)目提供,其他開發(fā)人員將能夠創(chuàng)造新的、更豐富的體驗(yàn)

4月14日, Meta 對(duì)外開源了一個(gè)人工智能項(xiàng)目,通過本次開源,可以讓任何人將他們的涂鴉變?yōu)楝F(xiàn)實(shí)動(dòng)畫。該公司希望通過將動(dòng)畫繪圖作為開源項(xiàng)目提供,其他開發(fā)人員將能夠創(chuàng)造新的、更豐富的體驗(yàn)。

Fundamental AI Research (FAIR) 團(tuán)隊(duì)最初于 2021 年發(fā)布了該工具的網(wǎng)絡(luò)版。它要求用戶上傳單個(gè)類人角色的繪圖或選擇一個(gè)演示圖。如果用戶使用自己的涂鴉,會(huì)看到一份同意書,詢問 Meta 是否可以使用繪圖來幫助訓(xùn)練其模型。

接下來,用戶需要調(diào)整捕獲框的大小,使其緊貼創(chuàng)作。該工具為用戶提供了一支筆和橡皮擦,可以在調(diào)整關(guān)節(jié)的位置之前調(diào)整繪圖。用戶會(huì)看到草圖的動(dòng)畫版本。用戶可以從四種類別的各種預(yù)設(shè)動(dòng)畫中進(jìn)行選擇:舞蹈、滑稽、跳躍和行走。

動(dòng)畫繪圖利用對(duì)象檢測(cè)模型、姿勢(shì)估計(jì)模型和基于圖像處理的分割方法來捕獲繪圖的數(shù)字版本。然后它使用傳統(tǒng)的計(jì)算機(jī)圖形技術(shù)對(duì)圖像進(jìn)行變形和動(dòng)畫處理。

在幾個(gè)月內(nèi)演示上線,用戶已授予 Meta 許可,可以將超過 160 萬張圖像用于訓(xùn)練目的。有些人上傳了公司標(biāo)志、動(dòng)漫人物、魚和毛絨動(dòng)物的圖像,盡管該工具規(guī)定只有人物形象才能工作。

除了對(duì)包含聲音效果和文本疊加的更深入工具集的請(qǐng)求外,人們上傳到該工具的一系列圖像表明人們對(duì)更廣泛的繪圖到動(dòng)畫體驗(yàn)有著廣泛的興趣。在某種程度上,這導(dǎo)致 Meta 開源了該項(xiàng)目的源代碼,其中包含約 180,000 張圖紙的數(shù)據(jù)集?!巴ㄟ^將模型和代碼作為開源發(fā)布,該項(xiàng)目為開發(fā)人員提供了一個(gè)構(gòu)建和擴(kuò)展項(xiàng)目的起點(diǎn),在開源社區(qū)中培養(yǎng)了創(chuàng)新和協(xié)作的文化,”Meta 在博客文章中寫道。

原創(chuàng)文章,作者:蘋果派,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/571092.html

蘋果派的頭像蘋果派管理團(tuán)隊(duì)

相關(guān)推薦