騰訊混元文生圖大模型開源訓(xùn)練代碼，發(fā)布LoRA與ControlNet插件

陳晨 ? 2024年6月21日 13:50:25 ? 產(chǎn)經(jīng)

6月21日，騰訊混元文生圖大模型（以下簡稱為混元DiT模型）宣布全面開源訓(xùn)練代碼，同時(shí)對外開源混元DiT LoRA 小規(guī)模數(shù)據(jù)集訓(xùn)練方案與可控制插件ControlNet。

這意味著，全球的企業(yè)與個(gè)人開發(fā)者、創(chuàng)作者們，都可以基于混元DiT訓(xùn)練代碼進(jìn)行精調(diào)，創(chuàng)造更具個(gè)性化的專屬模型，進(jìn)行更大自由度的創(chuàng)作；或基于混元DiT的代碼進(jìn)行修改和優(yōu)化，基于此構(gòu)建自身應(yīng)用，推動(dòng)技術(shù)的快速迭代和創(chuàng)新。

作為中文原生模型，用戶在通過混元DiT的訓(xùn)練代碼進(jìn)行精調(diào)時(shí)，可以直接使用中文的數(shù)據(jù)與標(biāo)簽，無需再將數(shù)據(jù)翻譯成英文。

此前，騰訊混元文生圖大模型宣布全面升級(jí)并對外開源，已在 Hugging Face 平臺(tái)及 Github 上發(fā)布，可供企業(yè)與個(gè)人開發(fā)者免費(fèi)商用。這是業(yè)內(nèi)首個(gè)中文原生的DiT架構(gòu)文生圖開源模型，支持中英文雙語輸入及理解。模型開源僅一個(gè)月，Github Star數(shù)達(dá)到2.4k，位于開源社區(qū)熱門DiT模型前列。

騰訊混元文生圖大模型開源訓(xùn)練代碼，發(fā)布LoRA與ControlNet插件

混元DiT Github項(xiàng)目頁面

在開源訓(xùn)練代碼的同時(shí)， LoRA小規(guī)模數(shù)據(jù)集訓(xùn)練方案與可控制插件ControlNet的發(fā)布也讓混元DiT模型的開源生態(tài)更具想象力。

LoRA模型，全稱Low-Rank Adaptation of Large Language Models，是一種用于微調(diào)大型語言模型的技術(shù)。在文生圖模型中，LoRA被用作一種插件，允許用戶在不修改原有模型與增加模型大小的情況下，利用少量數(shù)據(jù)訓(xùn)練出具有特定畫風(fēng)、IP或人物特征的模型。

LoRA技術(shù)在文生圖開源領(lǐng)域十分受歡迎，大量的創(chuàng)作者利用這種技術(shù)創(chuàng)造出多種多樣的模型，比如使用幾張個(gè)人照片，生成一個(gè)專屬于某個(gè)人的高精度照相館；或創(chuàng)造出盲盒、黏土等風(fēng)格模型。

AI圖像社區(qū)LiblibAI上的LoRA模型

混元DiT本次發(fā)布的專屬LoRA插件，支持開發(fā)者最少僅需一張圖即可創(chuàng)作出專屬的模型。比如，導(dǎo)入四張青花瓷圖片與相應(yīng)的提示詞，即可完成模型訓(xùn)練，創(chuàng)建了一個(gè)“青花瓷”生成模型：用戶輸入簡單提示詞，即可生成想要的青花瓷圖像。

部分訓(xùn)練數(shù)據(jù)：

訓(xùn)練后模型的推理結(jié)果示例：

使用混元DiT LoRA訓(xùn)練的青花瓷生成模型

本次上線的另一個(gè)插件ControlNet，則是一種應(yīng)用于文生圖領(lǐng)域的可控化生成算法，它允許用戶通過添加額外條件來更好地控制圖像的生成。

目前，騰訊混元提供了能提取與應(yīng)用圖像的邊緣（canny）、深度（depth）、人體姿勢（pose）等條件的三個(gè)首發(fā)ControlNet模型，讓開發(fā)者直接使用其進(jìn)行推理。該三個(gè)ControlNet插件能實(shí)現(xiàn)通過線稿生成全彩圖、生成具有同樣深度結(jié)構(gòu)的圖、生成具有同樣姿態(tài)的人等能力。同時(shí)，混元DiT也開源了ControlNet的訓(xùn)練方案，開發(fā)者與創(chuàng)作者可以訓(xùn)練自定義的ControlNet模型。

騰訊混元DiT上線的三個(gè)ControlNet插件效果演示

自混元DiT模型開源以來，得到了眾多開發(fā)者的支持和反饋，騰訊混元團(tuán)隊(duì)也一直在持續(xù)完善和優(yōu)化基于混元DiT的開源組件，與行業(yè)共建下一代視覺生成開源生態(tài)。本月初，混元DiT發(fā)布的專屬加速庫，可將推理效率進(jìn)一步提升，生圖時(shí)間縮短75%。同時(shí)模型易用性大幅提升，用戶可以基于ComfyUI的圖形化界面，使用混元DiT，或者通過Hugging Face Diffusers通用模型庫，僅用三行代碼即可調(diào)用混元DiT模型，無需下載原始代碼庫。

據(jù)了解，騰訊混元文生圖能力已廣泛被用于素材創(chuàng)作、商品合成、游戲出圖等多項(xiàng)業(yè)務(wù)及場景中。今年初，騰訊廣告基于騰訊混元大模型發(fā)布了一站式AI廣告創(chuàng)意平臺(tái)騰訊廣告妙思?！堆胍曅侣劇贰缎氯A日報(bào)》等20余家媒體也已經(jīng)將騰訊混元文生圖用于新聞內(nèi)容生產(chǎn)。

本文轉(zhuǎn)載自：，不代表科技訊之立場。原文鏈接：https://v.mrkbao.com/news/111202406211334417464154210.html

陳晨管理團(tuán)隊(duì)

0 0

產(chǎn)經(jīng)

如CGI一般的分子動(dòng)力學(xué)，讓科學(xué)家看到了3D渲染后的分子運(yùn)動(dòng)「影片」

唯物論有句經(jīng)典名言：世界是物質(zhì)的，物質(zhì)是運(yùn)動(dòng)的，運(yùn)動(dòng)是有規(guī)律的。這不僅是在描述人類所生活其中的宏觀世界，也道出了微觀世界的本質(zhì)。得益于理論發(fā)展、實(shí)驗(yàn)和計(jì)算技術(shù)的飛躍，人們對種種宏觀…

陳晨
7分鐘前
產(chǎn)經(jīng)

全面進(jìn)入大屏?xí)r代，三星電視雙十一家電購物狂歡進(jìn)行中

隨著消費(fèi)者對于觀影娛樂體驗(yàn)的要求愈發(fā)提升，大屏電視成為潮流趨勢。據(jù)奧維云網(wǎng)（AVC）數(shù)據(jù)顯示，2024年上半年，中國電視市場75英寸的產(chǎn)品零售量份額躍居第一。雙十一購物節(jié)正在火熱進(jìn)…

陳晨
8分鐘前
產(chǎn)經(jīng)

HUAWEI ADS 3.0、HarmonyOS 4鴻蒙座艙上車！

在新能源汽車日新月異的當(dāng)下，智能化體驗(yàn)的延續(xù)是產(chǎn)品。作為鴻蒙智行重磅車型，以及年交付超過20萬輛的國民SUV，截止10月20日，問界新M7今年累計(jì)銷量達(dá)到16.45萬。而隨著近期的…

陳晨
10分鐘前
產(chǎn)經(jīng)

HarmonyOS NEXT華為音樂煥新升級(jí)，打造高品質(zhì)沉浸式“音樂廳”

10月22日，“原生鴻蒙之夜暨華為全場景新品發(fā)布會(huì)”在深圳舉行，華為正式為用戶帶來全新的原生鴻蒙操作系統(tǒng)（HarmonyOS NEXT）。這是HarmonyOS誕生以來的重大升級(jí)，…

陳晨
1小時(shí)前
產(chǎn)經(jīng)

8條騎行拍攝Tips，賊出片！

周末在上海滴水湖邊追著日落騎行好舒服啊強(qiáng)烈推薦日落時(shí)分來騎行，真的能拍出人生照片！剛好今天來分享下一些騎行拍攝tips: 01追焦慢門，捕捉動(dòng)感找到一條安全的馬路，攝影師可以站…

陳晨
17小時(shí)前
產(chǎn)經(jīng)

小明Q3 Pro與當(dāng)貝Smart1投影儀測評對比：千元投影的極致性價(jià)比

對于初次接觸投影儀的消費(fèi)者來說,千元級(jí)別的產(chǎn)品無疑是既實(shí)惠又實(shí)用的選擇。在這個(gè)價(jià)位段中,小明Q3 Pro和當(dāng)貝Smart1兩款家用投影儀以其各自獨(dú)特的功能和優(yōu)勢,吸引了眾多消費(fèi)者的…

陳晨
17小時(shí)前
產(chǎn)經(jīng)

激光投影儀怎么選？當(dāng)貝推出全新超級(jí)投影F7 Pro，4K+護(hù)眼三色激光

在家庭影院逐漸成為現(xiàn)代家居的標(biāo)配之時(shí),激光投影儀以其卓越的畫質(zhì)和色彩表現(xiàn)力,成為了許多家庭升級(jí)觀影體驗(yàn)的首選。然而,面對市場上眾多品牌和型號(hào)的激光投影儀,如何挑選一款性價(jià)比高、性能…

陳晨
17小時(shí)前
產(chǎn)經(jīng)

7000元價(jià)位投影儀怎么選？當(dāng)貝推出F7 Pro，4K+護(hù)眼三色激光

在7000元價(jià)位選擇投影儀時(shí),消費(fèi)者面臨諸多選擇,而一款優(yōu)質(zhì)的投影儀能夠?yàn)槟募彝順O佳的觀影體驗(yàn)。以下是幾個(gè)關(guān)鍵要點(diǎn),幫助您在這個(gè)價(jià)位段內(nèi)做出明智的選擇。 ①光源技術(shù):優(yōu)先考慮…

陳晨
17小時(shí)前
產(chǎn)經(jīng)

橋田觀點(diǎn) | 高壁壘細(xì)分領(lǐng)域中國的品牌能夠做些什么？

1959年，美國推出世界第一臺(tái)工業(yè)機(jī)器人，當(dāng)時(shí)的功能還十分簡單，只能用于定點(diǎn)搬運(yùn)東西。1967年，日本從美國引進(jìn)第一臺(tái)工業(yè)機(jī)器人，開啟自主研發(fā)和產(chǎn)業(yè)化之路。在那之后的二十年，日本的…

陳晨
18小時(shí)前
產(chǎn)經(jīng)

什么是游戲玩家的“戰(zhàn)斗武器”？ 10月24日京東3C數(shù)碼采銷直播間揭曉答案

京東11.11期間，為滿足游戲玩家對電競筆記本的性能、品質(zhì)、輕薄便攜性的需求，10月24日，AMD大中華區(qū)銷售副總裁晁亞新及機(jī)械革命零售業(yè)務(wù)群總經(jīng)理李應(yīng)龍將做客京東3C數(shù)碼采銷直播…

陳晨
18小時(shí)前
產(chǎn)經(jīng)

華為攜手光明，共同打造粵港澳大灣區(qū)AI創(chuàng)新高地

10月22日，深圳市光明區(qū)人民政府與深圳華為云計(jì)算技術(shù)有限公司簽署了《共同推動(dòng)光明人工智能應(yīng)用服務(wù)中心合作協(xié)議》。簽約儀式上，深圳市光明區(qū)委常委、區(qū)委區(qū)政府辦公室主任李興亮，華為云…

陳晨
19小時(shí)前
產(chǎn)經(jīng)

產(chǎn)品設(shè)計(jì)再獲國際認(rèn)可，悅刻榮膺2024繆斯設(shè)計(jì)獎(jiǎng)

近日，美國國際獎(jiǎng)項(xiàng)協(xié)會(huì)“繆斯設(shè)計(jì)獎(jiǎng)” （MUSE Design Awards）公布年度獲獎(jiǎng)名單。RELX悅刻在海外市場推出的“悅刻旋風(fēng)”（RELX SPIN）和“悅刻創(chuàng)造者”（RE…

陳晨
19小時(shí)前
產(chǎn)經(jīng)

超千款鴻蒙原生游戲上架，華為游戲中心成就非凡游戲體驗(yàn)

10月22日，原生鴻蒙之夜暨華為全場景新品發(fā)布會(huì)在深圳舉行，華為正式為用戶帶來全新的原生鴻蒙操作系統(tǒng)（HarmonyOS NEXT），這是HarmonyOS誕生以來最大的更新。發(fā)布…

陳晨
20小時(shí)前
五大舉措打造鄉(xiāng)村振興幫扶“示范田” 中國平安在甘肅舉行支持產(chǎn)業(yè)振興及助農(nóng)協(xié)銷調(diào)研活動(dòng)

為鞏固拓展脫貧攻堅(jiān)成果，助力全面推進(jìn)鄉(xiāng)村振興戰(zhàn)略實(shí)施，著力打造鄉(xiāng)村振興定點(diǎn)幫扶示范典型項(xiàng)目，在第七個(gè)”中國農(nóng)民豐收節(jié)”到來之際，9月24日-25日，中國平安…

陳晨
產(chǎn)經(jīng) 20小時(shí)前
產(chǎn)經(jīng)

買5G選中興放心流量來京東中興U30 Air系列推出三款新品

10月23日，中興通訊推出了三款中興U30 Air 系列5G隨身WiFi新品，包括面向亞太國家或地區(qū)喜歡出游用戶的中興U30 Air亞太版，采用全新太空主題配色、專為大存儲(chǔ)辦公和備…

陳晨
20小時(shí)前
產(chǎn)經(jīng)

原生鴻蒙發(fā)布！搭載該系統(tǒng)的華為設(shè)備開機(jī)畫面將顯示“Powered by OpenHarmony”

10月22日，在原生鴻蒙之夜暨華為全場景新品發(fā)布會(huì)上，華為正式發(fā)布原生鴻蒙操作系統(tǒng)HarmonyOS NEXT，這也是繼蘋果iOS和安卓系統(tǒng)后，全球第三大移動(dòng)操作系統(tǒng)。據(jù)悉，此次發(fā)…

陳晨
20小時(shí)前
產(chǎn)經(jīng)

四大藍(lán)科技滿血集結(jié)，“一超多能”旗艦vivo X200系列發(fā)布

2024年10月14日北京 —— 10月14日，全新一代vivo X200系列旗艦手機(jī)在國家游泳中心（水立方）發(fā)布。作為重磅登場的國產(chǎn)旗艦系列，vivo X200系列首…

陳晨
21小時(shí)前
擎云智慧政務(wù)全場景解決方案獲2024安防行業(yè)優(yōu)秀解決方案獎(jiǎng)助力安防體系高質(zhì)量發(fā)展

10月22日，由中國安全防范產(chǎn)品行業(yè)協(xié)會(huì)組織的“2024安防行業(yè)優(yōu)秀解決方案”評選結(jié)果正式揭曉，華為擎云攜手合作伙伴打造的擎云智慧政務(wù)全場景解決方案獲得2024安防行業(yè)優(yōu)秀解決方案…

陳晨
產(chǎn)經(jīng) 21小時(shí)前
產(chǎn)經(jīng)

vivo X200全面評測，中杯旗艦的標(biāo)準(zhǔn)答案

最近，vivo攜手聯(lián)發(fā)科帶來了新一代旗艦手機(jī)——vivo X200。這款手機(jī)不僅繼承了vivo X系列一貫的優(yōu)雅設(shè)計(jì)和出色影像實(shí)力，還在性能、續(xù)航等多個(gè)方面實(shí)現(xiàn)了全面升級(jí)，為用戶帶…

陳晨
21小時(shí)前
鴻蒙生態(tài)蓬勃發(fā)展：超1萬5應(yīng)用和元服務(wù)上架，版本迭代日新月異

10月22日，華為在“原生鴻蒙之夜暨華為全場景新品發(fā)布會(huì)”上正式揭曉HarmonyOS NEXT。截至目前，鴻蒙生態(tài)設(shè)備數(shù)量已突破10億，超15000個(gè)應(yīng)用和元服務(wù)上架Harmon…

陳晨
產(chǎn)經(jīng) 21小時(shí)前

發(fā)表回復(fù)

登錄后才能評論

騰訊混元文生圖大模型開源訓(xùn)練代碼，發(fā)布LoRA與ControlNet插件

相關(guān)推薦

發(fā)表回復(fù)