OpenAI的Sora最強使用方法曝光！誰能申請Sora內(nèi)測賬戶？

潮玩君 ? 2024年2月18日 14:34:47 ? 新聞

OpenAI提前分享研究進展，旨在與OpenAI以外的人士合作并獲取反饋，讓公眾了解即將到來的AI技術(shù)新篇章

2月16日，OpenAI再次扔出一枚深水炸彈，發(fā)布了首個文生視頻模型Sora。據(jù)介紹，Sora可以直接輸出長達60秒的視頻，并且包含高度細致的背景、復雜的多角度鏡頭，以及富有情感的多個角色。

目前官網(wǎng)上已經(jīng)更新了48個視頻demo，在這些demo中，Sora不僅能準確呈現(xiàn)細節(jié)，還能理解物體在物理世界中的存在，并生成具有豐富情感的角色。該模型還可以根據(jù)提示、靜止圖像甚至填補現(xiàn)有視頻中的缺失幀來生成視頻。

例如一個Prompt（大語言模型中的提示詞）的描述是：在東京街頭，一位時髦的女士穿梭在充滿溫暖霓虹燈光和動感城市標志的街道上。

在Sora生成的視頻里，女士身著黑色皮衣、紅色裙子在霓虹街頭行走，不僅主體連貫穩(wěn)定，還有多鏡頭，包括從大街景慢慢切入到對女士的臉部表情的特寫，以及潮濕的街道地面反射霓虹燈的光影效果。

另一個Prompt則是，一只貓試圖叫醒熟睡的主人，要求吃早餐，主人試圖忽略這只貓，但貓嘗試了新招，最終主人從枕頭下拿出藏起來的零食，讓貓自己再多待一會兒。在這個AI生成視頻里，貓甚至都學會了踩奶，對主人鼻頭的觸碰甚至都是輕輕的，接近物理世界里貓的真實反應。

OpenAI表示，他們正在教AI理解和模擬運動中的物理世界，目標是訓練模型來幫助人們解決需要現(xiàn)實世界交互的問題。

隨后OpenAI解釋了Sora的工作原理，Sora是一個擴散模型，它從類似于靜態(tài)噪聲的視頻開始，通過多個步驟逐漸去除噪聲，視頻也從最初的隨機像素轉(zhuǎn)化為清晰的圖像場景。Sora使用了Transformer架構(gòu)，有極強的擴展性。

視頻和圖像是被稱為“補丁”的較小數(shù)據(jù)單位集合，每個“補丁”都類似于GPT中的一個標記（Token），通過統(tǒng)一的數(shù)據(jù)表達方式，可以在更廣泛的視覺數(shù)據(jù)上訓練和擴散變化，包括不同的時間、分辨率和縱橫比。

Sora是基于過去對DALL·E和GPT的研究基礎(chǔ)構(gòu)建，利用DALL·E 3的重述提示詞技術(shù)，為視覺模型訓練數(shù)據(jù)生成高描述性的標注，因此模型能更好的遵循文本指令。

對于Sora當前存在的弱點，OpenAI指出它可能難以準確模擬復雜場景的物理原理，并且可能無法理解因果關(guān)系。該模型還可能混淆提示的空間細節(jié)，例如混淆左右，并且可能難以精確描述隨著時間推移發(fā)生的事件，例如遵循特定的相機軌跡。

以此次發(fā)布的DEMO“與中國龍一起慶祝農(nóng)歷新年的視頻”為例，Sora無法準確生成視頻畫面中的中文受到了網(wǎng)友的關(guān)注。有相關(guān)人士對此調(diào)侃道：“莫非是中文太難了？”

但是任何事件的發(fā)生都是從無到有，再從有到精的過程。據(jù)悉，Sora如今正面向部分用戶開放，以評估關(guān)鍵領(lǐng)域的潛在危害或風險。同時，OpenAI也邀請了一批視覺藝術(shù)家、設(shè)計師和電影制作人加入，期望獲得寶貴反饋，以推動模型進步，更好地助力創(chuàng)意工作者。OpenAI提前分享研究進展，旨在與OpenAI以外的人士合作并獲取反饋，讓公眾了解即將到來的AI技術(shù)新篇章。

原創(chuàng)文章，作者：潮玩君，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/630773.html

潮玩君管理團隊

0 0

AI

OpenAI GPT-5研發(fā)受阻，成本高昂效果未及預期

近日，《華爾街日報》報道稱，OpenAI正在研發(fā)的下一代大型語言模型GPT-5遭遇研發(fā)難題，進度滯后且成果未達預期。這一消息與此前有關(guān)GPT-5可能無法實現(xiàn)顯著性能飛躍的報道相呼應…

AI
8小時前
AI

意大利對OpenAI罰款1500萬歐元，因ChatGPT數(shù)據(jù)隱私違規(guī)

近日，意大利數(shù)據(jù)保護機構(gòu)Garante發(fā)布公告，宣布對OpenAI處以1500萬歐元（約合1.14億元人民幣）的罰款。這一處罰是在對生成式AI應用使用個人數(shù)據(jù)情況進行調(diào)查后做出的?！?/p>

NEWS
1天前
AI

OpenAI更新macOS版ChatGPT，新增備忘錄及IDE支持

OpenAI近日對其macOS版ChatGPT應用進行了更新，新增了支持讀取macOS系統(tǒng)集成的備忘錄App（Apple Notes）及第三方備忘錄App如Notion等功能?，F(xiàn)在…

AI
1天前
AI

桌面版ChatGPT功能大升級：新增30余應用支持

在OpenAI的“12天活動”進入尾聲，在活動倒數(shù)第二天，公司展示了桌面版ChatGPT的功能改進。此次演示強調(diào)，ChatGPT正逐步從聊天機器人向AI智能體工具轉(zhuǎn)變，旨在桌面環(huán)境…

AI
2天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
4天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個新模型在理解現(xiàn)實世界物理、人類運動和表達的細微差別方面表現(xiàn)更出色，從而能夠進一步提升視頻整體的細節(jié)和逼真度?！?/p>

Google
5天前
AI

OpenAI向所有用戶開放ChatGPT搜索功能

在“OpenAI 12天”活動進展到第8天的時候，OpenAI發(fā)布了一則重要消息，現(xiàn)在所有登錄用戶都能夠使用ChatGPT搜索功能了。 OpenAI此次免費向所有用戶開放ChatG…

AI
5天前
AI

ChatGPT搜索引擎向所有用戶免費開放：新增實時搜索和高級語音功能

OpenAI推出搜索引擎工具，ChatGPT搜索功能獲大量更新，由GPT-4o模型支持，可快速獲取實時內(nèi)容，支持高級語音模式，移動端使用效率提升40%以上。

潮玩君
5天前
新聞

Meta要求加州阻止OpenAI轉(zhuǎn)營利計劃

據(jù)《華爾街日報》今日報道稱，Meta已致信加州總檢察長Rob Bonta，要求阻止OpenAI轉(zhuǎn)型為營利性企業(yè)的計劃。此舉表明，Meta在硅谷兩大AI巨頭間的爭斗中站在了馬斯克一方…

NEWS
2024年12月14日
AI

OpenAI ChatGPT全球宕機，部分服務(wù)逐步恢復中

今日，全球知名的人工智能公司OpenAI遭遇了一次重大服務(wù)中斷，其備受歡迎的聊天機器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機現(xiàn)象。此外，與ChatGPT相關(guān)的Sora服務(wù)及API接口…

AI
2024年12月12日
新聞

ChatGPT 高級語音模式研究員創(chuàng)立WaveForms AI 新公司估值達 2 億美元

近日，有媒體報道，曾主導開發(fā)ChatGPT高級語音模式的前OpenAI研究員Alexis Conneau宣布創(chuàng)立WaveForms AI。這家新公司已完成由Andreessen H…

潮玩君
2024年12月11日
AI

OpenAI推出Sora文生視頻AI模型，支持1080P高清視頻生成

昨日，OpenAI公司宣布正式推出其最新的Sora文生視頻AI模型。此次發(fā)布的新版本為Sora Turbo，相較于今年2月推出的預覽版，生成速度有了顯著提升。據(jù)了解，Sora T…

AI
2024年12月10日
AI

Sora二代實機演示曝光，支持圖生視頻功能

近日，關(guān)于Sora二代的實機演示視頻被曝光，展示了其強大的圖生視頻功能。據(jù)泄露視頻顯示，Sora v2不僅支持長達1分鐘的視頻輸出，還提供了三種生成模式，包括文本轉(zhuǎn)視頻、文本+圖像…

AI
2024年12月9日
AI

OpenAI新功能太強大，每月服務(wù)費200美元

近日，OpenAI在其“12天12場直播”活動的首秀中，發(fā)布了推理大模型o1的滿血版本及進階模式，并推出了ChatGPT Pro訂閱服務(wù)。這一服務(wù)每月收費200美元，為用戶提供了前…

AI
2024年12月7日
AI

OpenAI首次在瑞士設(shè)立辦公室，招募翟曉華等3名谷歌工程師推進研發(fā)多模態(tài)AI模型

OpenAI將在蘇黎世建新辦公室，拓展歐洲市場，吸納3位谷歌DeepMind AI專家推進多模態(tài)AI研發(fā)。蘇黎世為科技中心，翟曉華為資深AI科學家，曾是VisionTransformer作者之一。

科技探索者
2024年12月7日
AI

全球AI基礎(chǔ)設(shè)施支出將逐年增加預計2028年超過1000億美元

AI聊天機器人ChatGPT帶動AI領(lǐng)域投資增長，全球AI基礎(chǔ)設(shè)施投資預計連年增加，2028年將達1070億美元，上半年投資318億美元增37%，加速服務(wù)器比重將增至60%，5年復合年均增長率19%。

科技探索者
2024年11月30日
商業(yè)

OpenAI獲軟銀15億美元新投資，員工可在收購要約中出售股票

據(jù)外媒11月27日消息，OpenAI獲得了軟銀15億美元新投資。值得一提的是，這次投資允許OpenAI的員工在收購要約中出售他們的股票。據(jù)了解，員工們需要在12月24日之前決定是…

商業(yè)頭條
2024年11月27日
AI

OpenAI 首席產(chǎn)品官：ChatGPT 網(wǎng)頁端本周引入高級語音模式

OpenAI本周在ChatGPT網(wǎng)頁版上線高級語音模式，面向付費用戶。依托GPT-4o模型，可感知非語言信號并模仿情緒。Plus和Teams用戶有語音使用上限。OpenAI正優(yōu)化交互方式，免費用戶將有機會體驗。

潮玩君
2024年11月25日
新聞

iOS 19發(fā)布日期：預計2025年發(fā)布，新版Siri功能提前泄露

近日，彭博社的知名記者 Mark Gurman 在其發(fā)布的 Power On 時事通訊中，發(fā)布了關(guān)于 iOS 19發(fā)布時間的消息。據(jù)悉，iOS 19 預計將于 2025 年 6 月…

Apple
2024年11月25日
新聞

OpenAI計劃推出自研瀏覽器，正面挑戰(zhàn)谷歌Chrome

據(jù)外媒報道，人工智能巨頭OpenAI正考慮通過自行研發(fā)一款基于AI聊天機器人的瀏覽器，對全球搜索引擎巨頭谷歌發(fā)起直接競爭，特別是針對其廣受歡迎的Chrome瀏覽器。知情人士透露，…

AI
2024年11月22日