Stability AI發(fā)布Stable Video Diffusion模型把靜態(tài)圖片生成高質(zhì)量的視頻

AI ? 2023年11月22日 19:39:00 ? AI

初創(chuàng)公司Stability AI專注于開發(fā)人工智能（AI）產(chǎn)品，最近發(fā)布了一款令人期待的AI模型——Stable Video Diffusion。這款模型的獨(dú)特之處在于，它能夠通過現(xiàn)有的靜態(tài)圖片生成高質(zhì)量的視頻，是基于之前發(fā)布的Stable Diffusion文本轉(zhuǎn)圖片模型的延伸。目前市面上能夠生成視頻的AI模型相對較少，因此Stable Video Diffusion引起了廣泛關(guān)注。

然而，需要注意的是，Stable Video Diffusion目前并不對所有人開放。它目前處于Stability AI所謂的“研究預(yù)覽”階段。想要使用這款模型的人必須同意一些使用條款，其中規(guī)定了Stable Video Diffusion的預(yù)期應(yīng)用場景（例如“教育或創(chuàng)意工具”、“設(shè)計(jì)和其他藝術(shù)過程”等）以及非預(yù)期的場景（例如“對人或事件的事實(shí)或真實(shí)的表達(dá)”）。

Stable Video Diffusion實(shí)際上由兩個(gè)模型組成：SVD和SVD-XT。SVD可以將靜態(tài)圖片轉(zhuǎn)化為14幀的576×1024像素視頻，而SVD-XT則使用相同的架構(gòu)，但將幀數(shù)提高到24。兩者都能以每秒3到30幀的速度生成視頻。

根據(jù)Stability AI發(fā)布的白皮書，SVD和SVD-XT最初是在一個(gè)包含數(shù)百萬視頻的數(shù)據(jù)集上進(jìn)行訓(xùn)練的，然后在一個(gè)規(guī)模較小的數(shù)據(jù)集上進(jìn)行了“微調(diào)”，這個(gè)數(shù)據(jù)集只有幾十萬到一百萬左右的視頻片段。雖然這些視頻的來源并不十分清楚，但白皮書暗示許多是來自公開的研究數(shù)據(jù)集，因此無法判斷是否存在版權(quán)問題。

盡管Stable Video Diffusion還存在一些局限性，Stability AI對此也很坦誠。例如，這些模型不能生成沒有運(yùn)動或緩慢攝像機(jī)平移的視頻，也不能通過文本進(jìn)行控制，也不能渲染文字（至少不能清晰地渲染），也不能一致地“正確地”生成人臉和人物。

雖然目前還處于早期階段，但Stability AI指出這些模型非常具有擴(kuò)展性，可以適應(yīng)諸如生成物體的360度視圖等用例。最終，Stability AI的目標(biāo)是將Stable Video Diffusion商業(yè)化，稱其在“廣告、教育、娛樂等領(lǐng)域”都有潛在的應(yīng)用。這一新穎的AI模型無疑將為視頻生成領(lǐng)域帶來新的可能性。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/597666.html

AI Stability AI Stable Video Diffusion

AI認(rèn)證作者

0 0

AI

微軟推出10款新AI代理，銷售、財(cái)務(wù)都覆蓋，與Salesforce競爭升級

值得一提的是，用戶可以在Copilot Studio中，通過低代碼或無代碼指令，輕松創(chuàng)建自主代理。用戶只需設(shè)定代理的目標(biāo)，例如整理郵件請求，代理便能自動完成任務(wù)。

蘋果派
15小時(shí)前
驍龍峰會2024直擊：榮耀攜手高通，共同定義AI原生應(yīng)用場景

榮耀終端公司CMO郭銳出席高通峰會，分享榮耀與高通在AI領(lǐng)域的合作成果。榮耀Magic7系列首次曝光，將搭載生成式AI能力。雙方共同定義AI時(shí)代應(yīng)用場景，在智慧互聯(lián)、交互和性能上帶來革命性體驗(yàn)。

潮玩君
新聞 20小時(shí)前
新聞

臺積電ADR大漲近10%創(chuàng)新高，AI熱潮提振營收預(yù)期

昨日（10月17日），臺積電（TSMC）的美國存托憑證（ADR）在收盤時(shí)達(dá)到了205.84美元，較前一個(gè)交易日上漲了18.36美元，漲幅高達(dá)9.79%。盤中，其價(jià)格更是觸及了自19…

小丸子
4天前
AI

2024 OPPO開發(fā)者大會：攜手共建人人可參與的AI新世界

?OPPO發(fā)布全新ColorOS 15，聚焦流暢、AI、設(shè)計(jì)、易用性等方面全面革新，帶來超輕快、更自在的智慧流暢體驗(yàn)。

潮玩君
5天前
新聞

微軟生成式AI副總裁Bubeck離職，加入OpenAI推進(jìn)通用人工智能研究

微軟公司于當(dāng)?shù)貢r(shí)間10月14日正式宣布，其生成式人工智能（AI）研究的副總裁Sébastien Bubeck（塞巴斯蒂安?布貝克）將離職，并加入ChatGPT的制造商OpenAI，…

Microsoft
2024年10月15日
AI

【直播已結(jié)束】2024 OPPO 開發(fā)者大會

ODC24 將發(fā)布 ColorOS 15 輕快流暢、自在 AI 的全新體驗(yàn)，帶來 OPPO AI 最新技術(shù)進(jìn)展，與合作伙伴共建智慧生態(tài)。讓 AI，更近一步。

潮玩君
2024年10月15日
AI

OpenAI Playground新增“元提示”工具，助力高效創(chuàng)建AI提示詞

在人工智能（AI）時(shí)代，如何精準(zhǔn)地提出合適的提示詞（Prompt）成為了影響AI應(yīng)用效果的關(guān)鍵因素之一。近日，科技媒體The Decoder報(bào)道了OpenAI對其提示詞優(yōu)化功能Pl…

AI
2024年10月12日
AI

vivo發(fā)布藍(lán)心智能AI戰(zhàn)略，大模型與操作系統(tǒng)深度融合

在今日上午舉行的2024 vivo開發(fā)者大會開幕演講中，vivo正式公布了其藍(lán)心智能AI戰(zhàn)略，旨在通過AI技術(shù)重構(gòu)系統(tǒng)體驗(yàn)，并與大模型實(shí)現(xiàn)深度融合，向整個(gè)行業(yè)全面開放。 vivo表…

NEWS
2024年10月10日
新聞

蘋果計(jì)劃推出AI功能AirPods 為智能眼鏡開發(fā)打基礎(chǔ)

根據(jù)之前的估計(jì)，這款智能眼鏡可能將在2027年推出，但在此之前，蘋果實(shí)際上正在開發(fā)另一款產(chǎn)品。最新報(bào)告稱這將為其即將推出的可穿戴技術(shù)鋪平道路。這款產(chǎn)品便是一款具備AI功能和攝像頭模塊的新款A(yù)irPods。

蘋果派
2024年10月7日
新聞

英偉達(dá)CEO黃仁勛：核電是滿足數(shù)據(jù)中心爆炸式增長能源需求優(yōu)秀選擇

據(jù)彭博社報(bào)道，英偉達(dá) CEO 黃仁勛在接受彭博電視臺采訪時(shí)表示，核電是滿足數(shù)據(jù)中心節(jié)節(jié)增長能源需求的一種優(yōu)秀選擇。

科技探索者
2024年9月30日
產(chǎn)品

海信AI電視E7N正式發(fā)布，引領(lǐng)AI畫質(zhì)新標(biāo)桿

海信正式發(fā)布AI電視新品E7N，集信芯AI畫質(zhì)芯片 Pro、自研星海AI大模型、超畫質(zhì)Mini LED、深度定制的柔光防眩屏，以及AI旗艦 SOC芯片于一體，以AI賦能，打造電視大屏AI畫質(zhì)新標(biāo)桿。

科技探索者
2024年9月30日
新聞

亞馬遜40億美元投資AI公司Anthropic交易獲英國批準(zhǔn)

英國反壟斷監(jiān)管機(jī)構(gòu)“競爭和市場管理局”（CMA）今日宣布，不會對亞馬遜40億美元投資AI初創(chuàng)公司Anthropic交易展開進(jìn)一步的調(diào)查。

潮玩君
2024年9月29日
AI

任天堂出手：AI 生成的馬力歐圖片遭大規(guī)模下架

近期一款人工智能驅(qū)動的版權(quán)工具成功刪除了大量包含 AI 生成的馬里歐圖片的 X 帖子，該工具屬于一家名為 Tracer 的公司，該公司利用人工智能識別出了這些圖像，并代表任天堂向 X 平臺發(fā)出下架通知。

蘋果派
2024年9月25日
AI

Anthropic 擬以 300-400 億美元估值融資，加速與 OpenAI 競爭

美國人工智能（AI）初創(chuàng)公司Anthropic 正在積極與投資者洽談新一輪融資事宜，據(jù)《The Information》報(bào)道，此次融資后，Anthropic 的估值有望飆升至300…

AI
2024年9月24日
新聞

iPhone 16發(fā)售前價(jià)格已“破發(fā)”？有平臺降價(jià)達(dá)千元

蘋果最新發(fā)布的iPhone 16系列智能手機(jī)即將于9月20日在全球正式發(fā)售。但相較于往年的熱度，今年蘋果手機(jī)在中國市場“遇冷”，已經(jīng)有電商平臺提供了高達(dá)千元的折扣。

潮玩君
2024年9月20日
新聞

YouTube 將推出 AI“一站式服務(wù)”：可生成創(chuàng)意、標(biāo)題、完整視頻

據(jù) The Verge 報(bào)道，在當(dāng)?shù)貢r(shí)間周三（今天）舉行的“Made on YouTube”特別活動上，谷歌宣布為 YouTube 帶來一系列 AI 相關(guān)功能，有望改變視頻制作的方式乃至視頻本身。

蘋果派
2024年9月19日
新聞

2024 OPPO開發(fā)者大會官宣，帶來ColorOS 15新體驗(yàn)、AI新技術(shù)、智慧新生態(tài)

OPPO宣布2024年OPPO開發(fā)者大會（ODC24）將于10月17日在杭州大會展中心舉辦。此次大會以“AI，更近一步”為主題，帶來全面煥新的ColorOS 15、更實(shí)用的AI體驗(yàn)以及持續(xù)進(jìn)化的生態(tài)平臺能力。

潮玩君
2024年9月19日
新聞

英特爾CEO提出降本增效新舉措：7500 多員工已離職，計(jì)劃年底前大幅削減房地產(chǎn)

英特爾代工業(yè)務(wù)的關(guān)鍵優(yōu)先事項(xiàng)是提高資本效率。我們在三大洲的制造投資為 AI 時(shí)代的頂級代工業(yè)務(wù)奠定了基礎(chǔ)?，F(xiàn)在，我們已經(jīng)完成了向 EUV 的過渡，是時(shí)候從加速投資階段轉(zhuǎn)向更正常的節(jié)點(diǎn)開發(fā)節(jié)奏和更靈活、更高效的資本計(jì)劃。

潮玩君
2024年9月18日
新聞

Meta承認(rèn)收集澳大利亞成年人公共數(shù)據(jù)訓(xùn)練AI，但無退出選項(xiàng)

當(dāng)?shù)貢r(shí)間11日，全球社交媒體巨頭Meta公司因其在澳大利亞的數(shù)據(jù)收集和使用行為再次引發(fā)關(guān)注。據(jù)澳大利亞廣播公司（ABC）報(bào)道，Meta公司公開承認(rèn)，其平臺上已收集了所有澳大利亞成年…

小科同學(xué)
2024年9月14日
AI

法國AI初創(chuàng)Mistral發(fā)布Pixtral 12B：多模態(tài)AI大模型亮相

法國人工智能（AI）初創(chuàng)公司Mistral于9月11日宣布推出其首款多模態(tài)AI大模型——Pixtral 12B，該模型以其強(qiáng)大的圖像與文本處理能力，在AI領(lǐng)域引起了廣泛關(guān)注。Pix…

AI
2024年9月12日

發(fā)表回復(fù)

登錄后才能評論

Stability AI發(fā)布Stable Video Diffusion模型把靜態(tài)圖片生成高質(zhì)量的視頻

相關(guān)推薦

發(fā)表回復(fù)