清華團(tuán)隊(duì)與生數(shù)科技攜手發(fā)布視頻大模型”Vidu” 對(duì)標(biāo)“Sora”更強(qiáng)悍

科技探索者 ? 2024年4月28日 08:23:26 ? 新聞

生數(shù)科技與清華大學(xué)攜手，正式推出了中國(guó)首個(gè)具備長(zhǎng)時(shí)長(zhǎng)、高一致性及高動(dòng)態(tài)性的視頻大模型——“Vidu”

在中關(guān)村論壇的未來人工智能先鋒論壇中，生數(shù)科技與清華大學(xué)攜手，正式推出了中國(guó)首個(gè)具備長(zhǎng)時(shí)長(zhǎng)、高一致性及高動(dòng)態(tài)性的視頻大模型——“Vidu”。

清華團(tuán)隊(duì)與生數(shù)科技攜手發(fā)布視頻大模型"Vidu" 對(duì)標(biāo)“Sora”更強(qiáng)悍

這款引領(lǐng)時(shí)代的視頻大模型，其核心在于團(tuán)隊(duì)原創(chuàng)的Diffusion與Transformer融合的U-ViT架構(gòu)。它不僅能一鍵生成長(zhǎng)達(dá)16秒、清晰度達(dá)到1080P的高清視頻，更能在模擬真實(shí)物理世界的同時(shí)，展現(xiàn)出驚人的想象力。多鏡頭生成、時(shí)空高度一致，這些都是Vidu的獨(dú)特魅力。

值得一提的是，Vidu自發(fā)布以來，便在全球范圍內(nèi)取得了顯著突破，其性能與國(guó)際頂尖水平比肩，并仍在不斷迭代優(yōu)化中。這一成就，離不開團(tuán)隊(duì)在貝葉斯機(jī)器學(xué)習(xí)和多模態(tài)大模型領(lǐng)域的深厚積累和多項(xiàng)原創(chuàng)性成果。

特別是團(tuán)隊(duì)于2022年9月提出的U-ViT架構(gòu)，作為全球首個(gè)Diffusion與Transformer的融合架構(gòu)，為Vidu的誕生奠定了堅(jiān)實(shí)基礎(chǔ)。隨后，在2023年3月，團(tuán)隊(duì)再次領(lǐng)先，開源了基于U-ViT融合架構(gòu)的多模態(tài)擴(kuò)散模型UniDiffuser，成功驗(yàn)證了U-ViT架構(gòu)的大規(guī)?？蓴U(kuò)展性。

基于對(duì)U-ViT架構(gòu)的深入理解和豐富的工程、數(shù)據(jù)經(jīng)驗(yàn)，團(tuán)隊(duì)在極短的時(shí)間內(nèi)攻克了長(zhǎng)視頻表示與處理的多項(xiàng)關(guān)鍵技術(shù)難題，從而研發(fā)出了Vidu視頻大模型。這款模型在提升視頻連貫性和動(dòng)態(tài)性方面表現(xiàn)出色，進(jìn)一步推動(dòng)了視頻處理技術(shù)的發(fā)展。

Vidu的問世，不僅再次驗(yàn)證了U-ViT融合架構(gòu)在大規(guī)模視覺任務(wù)中的卓越性能，也展示了生數(shù)科技在多模態(tài)原生大模型領(lǐng)域的持續(xù)創(chuàng)新能力和行業(yè)領(lǐng)先地位。作為通用視覺模型，Vidu能夠生成更加多樣化、更長(zhǎng)時(shí)長(zhǎng)的視頻內(nèi)容，其靈活的架構(gòu)也將為未來兼容更廣泛的模態(tài)、拓展多模態(tài)通用能力的邊界提供無限可能。

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請(qǐng)注明出處：http://2079x.cn/article/651014.html

科技探索者管理團(tuán)隊(duì)

0 0

AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個(gè)新模型在理解現(xiàn)實(shí)世界物理、人類運(yùn)動(dòng)和表達(dá)的細(xì)微差別方面表現(xiàn)更出色，從而能夠進(jìn)一步提升視頻整體的細(xì)節(jié)和逼真度?！?/p>

Google
2024年12月17日
AI

OpenAI ChatGPT全球宕機(jī)，部分服務(wù)逐步恢復(fù)中

今日，全球知名的人工智能公司OpenAI遭遇了一次重大服務(wù)中斷，其備受歡迎的聊天機(jī)器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機(jī)現(xiàn)象。此外，與ChatGPT相關(guān)的Sora服務(wù)及API接口…

AI
2024年12月12日
AI

OpenAI推出Sora文生視頻AI模型，支持1080P高清視頻生成

昨日，OpenAI公司宣布正式推出其最新的Sora文生視頻AI模型。此次發(fā)布的新版本為Sora Turbo，相較于今年2月推出的預(yù)覽版，生成速度有了顯著提升。據(jù)了解，Sora T…

AI
2024年12月10日
AI

Sora二代實(shí)機(jī)演示曝光，支持圖生視頻功能

近日，關(guān)于Sora二代的實(shí)機(jī)演示視頻被曝光，展示了其強(qiáng)大的圖生視頻功能。據(jù)泄露視頻顯示，Sora v2不僅支持長(zhǎng)達(dá)1分鐘的視頻輸出，還提供了三種生成模式，包括文本轉(zhuǎn)視頻、文本+圖像…

AI
2024年12月9日
游戲

玩具反斗城發(fā)布全球首部Sora大模型制作宣傳片

全球知名玩具零售商“玩具反斗城”于當(dāng)?shù)貢r(shí)間6月24日發(fā)布了其全球首部利用OpenAI視頻生成大模型Sora制作的宣傳片《玩具反斗城的起源》。這部宣傳片以其獨(dú)特的創(chuàng)意和生動(dòng)的視覺效果…

AI
2024年6月27日
AI

快手推出自研視頻生成大模型“可靈”，邀測(cè)體驗(yàn)正式開放

在人工智能領(lǐng)域取得又一重要突破，快手公司今日宣布其自研的視頻生成大模型“可靈”正式上線，并向公眾開放邀測(cè)體驗(yàn)。該模型采用與Sora相似的技術(shù)路線，并結(jié)合多項(xiàng)自研技術(shù)創(chuàng)新，旨在為用戶…

AI
2024年6月7日
經(jīng)驗(yàn)

OpenAI Sora 如何使用：最新詳細(xì)教程-新手小白必看

目前 openai 官方還未開放 sora 灰度，不過根據(jù)文生圖模型 DALL·E 案例，一定是先給 ChatGPT Plus 付費(fèi)用戶使用，需要注冊(cè)或者升級(jí) GPT Plus 可以看這個(gè)教程: 升級(jí) ChatGPT Plus 的教程，一分鐘完成升級(jí)Sora能夠根據(jù)簡(jiǎn)單的文本描述，生成高達(dá)60秒的高質(zhì)量視頻，使得視頻創(chuàng)作變得前所未有的簡(jiǎn)單和高效。

科技探索者
2024年6月3日
經(jīng)驗(yàn)

OpenAI Sora入口在哪？ Sora使用方法介紹

OpenAI在人工智能領(lǐng)域一直走在前列，近日再次引領(lǐng)潮流，推出了名為Sora的文本到視頻模型。那么OpenAI Sora入口在哪呢？下面給大家介紹下OpenAI Sora使用方法。

科技探索者
2024年6月3日
AI

谷歌CEO警告OpenAI：若依賴YouTube訓(xùn)練AI視頻模型將采取法律行動(dòng)

在近日的一次公開場(chǎng)合中，谷歌公司CEO桑達(dá)爾·皮查伊就人工智能（AI）領(lǐng)域的競(jìng)爭(zhēng)態(tài)勢(shì)發(fā)表了重要言論。他警告稱，如果確定微軟支持的OpenAI依賴YouTube內(nèi)容來訓(xùn)練其能夠生成視…

Google
2024年5月18日
AI

谷歌發(fā)布新型視頻生成模型Veo，挑戰(zhàn)OpenAI的Sora

在人工智能領(lǐng)域，視頻生成技術(shù)一直是研究的熱點(diǎn)。近日，谷歌2024 I/O開發(fā)者大會(huì)上宣布推出一款名為Veo的新型視頻生成模型，劍指OpenAI三個(gè)月前推出的Sora，展示了其在視頻…

科技新聞
2024年5月15日
AI

Sora視頻生成器：使用中的真相與挑戰(zhàn)

在年初的科技浪潮中，OpenAI發(fā)布的Sora視頻生成器以其文生視頻的革命性突破，一度引起全球矚目，被視為好萊塢未來發(fā)展的新動(dòng)力。然而，隨著Shy Kids等藝術(shù)家團(tuán)隊(duì)開始深入使用…

AI
2024年5月13日
AI

OpenAI Sora打造首支自動(dòng)生成MV，助力大導(dǎo)演圓夢(mèng)

在數(shù)字創(chuàng)意領(lǐng)域的一次重大突破中，OpenAI的Sora技術(shù)成功助力知名編劇兼導(dǎo)演Paul Trillo實(shí)現(xiàn)了他十年前未能完成的MV制作夢(mèng)想。近日，Trillo發(fā)布了首支完全利用Op…

AI
2024年5月5日
AI

視頻大模型Vidu怎么樣？Vidu詳細(xì)介紹

在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域，大模型是近年來的一個(gè)熱門話題。它們憑借強(qiáng)大的計(jì)算能力和海量的數(shù)據(jù)資源，不斷刷新著人工智能技術(shù)的邊界。其中，視頻大模型Vidu憑借其獨(dú)特的架構(gòu)和出色的性能，…

AI
2024年4月28日
AI

Vidu vs Sora：視頻大模型巔峰對(duì)決，誰(shuí)將更勝一籌引領(lǐng)風(fēng)潮？

在視頻大模型領(lǐng)域，Vidu和Sora無疑是兩顆璀璨的明星。它們分別代表了中國(guó)和美國(guó)在人工智能領(lǐng)域的最新成果，各自具有獨(dú)特的優(yōu)勢(shì)和特點(diǎn)。那么Vidu vs Sora誰(shuí)更強(qiáng)一些呢？本文…

科學(xué)
2024年4月28日
AI

視頻大模型“Vidu”發(fā)布：一鍵生成16秒高清視頻，逼近Sora水平

今日，生數(shù)科技聯(lián)合清華大學(xué)發(fā)布了其最新的視頻大模型“Vidu”，這一成果在AI視頻生成領(lǐng)域引起了廣泛關(guān)注。據(jù)悉，“Vidu”支持一鍵生成長(zhǎng)達(dá)16秒、分辨率高達(dá)1080p的高清視頻內(nèi)…

AI
2024年4月28日
新聞

Adobe加速布局AI視頻生成技術(shù)，采購(gòu)視頻素材追趕OpenAI

在科技巨頭OpenAI展示了其先進(jìn)的文本到視頻生成技術(shù)Sora后，創(chuàng)意軟件領(lǐng)域的領(lǐng)軍者Adobe公司不甘示弱，開始積極采購(gòu)視頻素材，旨在構(gòu)建自身AI驅(qū)動(dòng)的文本到視頻生成器。這一舉措…

若安丶
2024年4月11日
新聞

谷歌AI負(fù)責(zé)人迷茫：怎么減少內(nèi)斗和人才流失，拿什么趕超OpenAI

4月9日消息，據(jù)美媒theinformation報(bào)道，谷歌人工智能部門的主管德米斯·哈薩比斯（Demis Hassabis）對(duì)公司在推動(dòng)人工智能商業(yè)化上的新策略深表失望，并曾在兩個(gè)AI部門合并成立新實(shí)驗(yàn)室時(shí)考慮過離職。

蘋果派
2024年4月9日
AI

OpenAI涉嫌未經(jīng)授權(quán)抓取YouTube視頻訓(xùn)練AI模型Sora引發(fā)爭(zhēng)議

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI陷入了一場(chǎng)關(guān)于數(shù)據(jù)收集合規(guī)性的爭(zhēng)議。據(jù)《華爾街日?qǐng)?bào)》和《紐約時(shí)報(bào)》報(bào)道，OpenAI在收集高質(zhì)量訓(xùn)練數(shù)據(jù)時(shí)遇到了困難，并涉嫌未經(jīng)授權(quán)地使用了…

科技新聞
2024年4月8日
AI

YouTube CEO警告OpenAI：使用視頻訓(xùn)練AI模型屬違規(guī)

YouTube首席執(zhí)行官尼爾·莫漢（Neal Mohan）近日在接受媒體采訪時(shí)，就OpenAI旗下文本生成視頻AI模型Sora的訓(xùn)練數(shù)據(jù)問題發(fā)表看法。莫漢雖然沒有直接證據(jù)表明Ope…

聆聽
2024年4月7日
AI

OpenAI發(fā)布首支由AI模型生成的音樂短片，展現(xiàn)藝術(shù)新境界

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI在其官方Y(jié)ouTube頻道上發(fā)布了一支由AI模型Sora生成的音樂短片《Worldweight》。這支短片由August Kamp參與制作，…

AI
2024年4月5日