谷歌推出全能視頻編碼器VideoPrism 性能超越30項(xiàng)SOTA

秋秋 ? 2024年2月26日 14:00:00 ? 新聞

谷歌研究團(tuán)隊(duì)近日發(fā)布了全新的通用視頻編碼器——VideoPrism，其在3600萬高質(zhì)量視頻字幕對和5.82億視頻剪輯的數(shù)據(jù)集上進(jìn)行了訓(xùn)練，并在33項(xiàng)視頻理解基準(zhǔn)測試中刷新了30項(xiàng)SOTA（最先進(jìn)技術(shù)）成績。

VideoPrism的設(shè)計(jì)旨在通過單一凍結(jié)模型處理各種視頻理解任務(wù)，包括分類、定位、檢索、字幕和問答等。其設(shè)計(jì)理念主要基于預(yù)訓(xùn)練數(shù)據(jù)和兩階段訓(xùn)練法。預(yù)訓(xùn)練數(shù)據(jù)方面，谷歌團(tuán)隊(duì)通過匯集高質(zhì)量視頻字幕對和帶有噪聲的并行文本，構(gòu)建了一個(gè)龐大的語料庫。在建模方面，VideoPrism采用了對比學(xué)習(xí)和掩碼視頻建模兩個(gè)階段，以優(yōu)化語義視頻嵌入和全局提煉。

VideoPrism的出色表現(xiàn)不僅體現(xiàn)在分類和定位任務(wù)上，還能進(jìn)行視頻-文本檢索和QA問答。例如，給定一段視頻，VideoPrism可以準(zhǔn)確地檢索出與文本內(nèi)容相匹配的視頻片段，或者根據(jù)視頻內(nèi)容回答相關(guān)問題。

谷歌團(tuán)隊(duì)表示，VideoPrism的成功驗(yàn)證了通用視覺編碼器在視頻理解領(lǐng)域的巨大潛力。未來，隨著數(shù)據(jù)集的擴(kuò)大和模型的不斷優(yōu)化，VideoPrism有望在更多領(lǐng)域?qū)崿F(xiàn)突破，為視頻理解和應(yīng)用提供更強(qiáng)大的支持。

原創(chuàng)文章，作者：秋秋，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/632435.html

VideoPrism 谷歌

秋秋管理團(tuán)隊(duì)

0 0

手機(jī)

谷歌Pixel 10 Pro渲染圖曝光：攝像頭模組采用豎排設(shè)計(jì)

近日，國外知名設(shè)計(jì)師4RMD放出了一組谷歌Pixel 10 Pro渲染圖，展示了其全新的外觀設(shè)計(jì)。與之前的谷歌Pixel系列手機(jī)不同，Pixel 10 Pro的攝像頭模組從橫排改為…

Google
2024年12月27日
AI

谷歌被指使用Anthropic Claude模型優(yōu)化Gemini AI

近日，據(jù)知情人士透露，谷歌在改進(jìn)其Gemini人工智能模型的過程中，疑似使用了競爭對手Anthropic的Claude模型進(jìn)行對比測試。這一行為引發(fā)了關(guān)于谷歌是否獲得Anthrop…

Google
2024年12月25日
新聞

谷歌反壟斷案新進(jìn)展：提出三年禁默認(rèn)搜索協(xié)議折中方案

在反壟斷審判中戰(zhàn)勝谷歌后，美國司法部近日提出了一系列針對谷歌搜索業(yè)務(wù)的改革方案。對此，谷歌做出了回應(yīng)，提出了一項(xiàng)折中方案。根據(jù)方案顯示，谷歌同意禁止與安卓手機(jī)制造商達(dá)成默認(rèn)搜索位…

Google
2024年12月24日
新聞

谷歌YouTube印度站將嚴(yán)厲打擊“標(biāo)題黨”“封面黨”

近日，谷歌在其YouTube印度博客網(wǎng)站上發(fā)布了一則重要公告，宣布將針對平臺上長期存在的“標(biāo)題黨”“封面黨”視頻進(jìn)行嚴(yán)厲打擊。谷歌指出，這些視頻往往制作粗糙、內(nèi)容空洞，僅僅依靠夸…

Google
2024年12月21日
AI

谷歌Gemini AI深度研究模式新增支持中文等40多種語言

谷歌公司近日宣布，其旗下的Gemini AI深度研究模式現(xiàn)已新增支持中文等40多種語言。這一功能旨在為用戶提供強(qiáng)大的AI研究輔助能力，并已向Google One AI高級計(jì)劃用戶開…

Google
2024年12月21日
AI

傳聞Google Tensor G5或?qū)売萌峭ㄓ嵞＝M，轉(zhuǎn)投聯(lián)發(fā)科T900

近日，有關(guān)Google Tensor G5處理器的最新消息傳出。據(jù)外媒報(bào)道，Google在綜合考慮了多種通訊模組選項(xiàng)后，決定在Tensor G5處理器上采用聯(lián)發(fā)科尚未發(fā)布的T900…

Google
2024年12月18日
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個(gè)新模型在理解現(xiàn)實(shí)世界物理、人類運(yùn)動和表達(dá)的細(xì)微差別方面表現(xiàn)更出色，從而能夠進(jìn)一步提升視頻整體的細(xì)節(jié)和逼真度。…

Google
2024年12月17日
產(chǎn)品

谷歌Astra智能眼鏡曝光，將融合AI與AR技術(shù)

今日，有消息稱，谷歌DeepMind網(wǎng)站為Project Astra項(xiàng)目開辟了新的測試頻道，打算邀請部分用戶對Astra智能眼鏡進(jìn)行測試。據(jù)了解，這款原型眼鏡融合了AI和AR技術(shù)，…

Google
2024年12月17日
新聞

谷歌推送Android 15 QPR2 Beta 2更新，多設(shè)備可享

今日，谷歌針對Pixel設(shè)備推出了Android 15 QPR2 Beta 2更新，版本號為BP11.241121.010。QPR是季度平臺發(fā)布，能讓用戶提前體驗(yàn)Pixel Fea…

Android
2024年12月17日
手機(jī)

谷歌Pixel 10系列傳聞：或采用聯(lián)發(fā)科T900調(diào)制解調(diào)器

有外媒近日報(bào)道了一則關(guān)于谷歌Pixel 10系列傳聞的最新消息。據(jù)谷歌內(nèi)部消息人士透露，谷歌計(jì)劃在下一代Pixel手機(jī)中放棄高通和三星的調(diào)制解調(diào)器方案，轉(zhuǎn)而選擇聯(lián)發(fā)科尚未發(fā)布的T9…

Google
2024年12月16日
新聞

YouTube TV宣布將于2025年漲價(jià)，漲幅約為13.6%

據(jù)報(bào)道，當(dāng)?shù)貢r(shí)間周四，谷歌旗下視頻直播平臺YouTube TV向訂閱者發(fā)送郵件，宣布將于2025年1月13日起調(diào)整服務(wù)價(jià)格。據(jù)悉，YouTube TV的基礎(chǔ)套餐月費(fèi)將從目前的72…

Google
2024年12月15日
新聞

谷歌AI2.0：開啟多模態(tài)、多步驟搜索新時(shí)代，明年將向全球開放

谷歌發(fā)布AI模型Gemini2.0，整合進(jìn)AIOverviews中，實(shí)現(xiàn)多模態(tài)、多步驟搜索體驗(yàn)升級，計(jì)劃全球化布局，面對挑戰(zhàn)持續(xù)優(yōu)化，未來AI搜索將發(fā)揮重要作用。

蘋果派
2024年12月15日
新聞

谷歌 NotebookLM 新功能上線：用戶可與 AI 主播進(jìn)行互動

谷歌NotebookLM推新功能，用戶可與AI“主持人”對話提問，獲個(gè)性化回答。界面重設(shè)分三區(qū)，還推NotebookLMPlus訂閱服務(wù)，享更多資源、自定義回答等，已向企業(yè)學(xué)校等機(jī)構(gòu)開放，預(yù)計(jì)2025年初加入GoogleOneAIPremium。

科技探索者
2024年12月14日
AI

谷歌發(fā)布Gemini 2.0模型及Deep Research新功能

谷歌官方近日宣布，正式推出其最新一代人工智能模型——Gemini 2.0。據(jù)了解，自當(dāng)?shù)貢r(shí)間12月11日起，谷歌已將Gemini 2.0開放給開發(fā)者及受信任的測試人員，并正積極推進(jìn)…

Google
2024年12月13日
新聞

傳聞谷歌或?qū)⒂诿髂?月啟動新一輪裁員

近日，有傳聞稱，谷歌計(jì)劃于明年1月啟動新一輪裁員，裁員標(biāo)準(zhǔn)也有所提高。據(jù)了解，谷歌將按照一定比例裁掉績效不佳的員工，盡管工程師整體生產(chǎn)力有所提升。此次谷歌裁員中，谷歌將績效考核“…

Google
2024年12月12日
手機(jī)

谷歌Pixel 9a規(guī)格曝光：搭載Tensor G4 芯片

昨日，有外媒曝光了谷歌Pixel 9a手機(jī)的完整規(guī)格信息。據(jù)了解，Pixel 9a將搭載Google Tensor G4處理器和Titan M2安全芯片，配備8GB LPDDR5X…

Google
2024年12月12日
新聞

谷歌支付遭美監(jiān)管機(jī)構(gòu)監(jiān)控提起訴訟反抗

近日，據(jù)路透社消息，美國消費(fèi)者金融保護(hù)局（CFPB）宣布將谷歌支付公司置于聯(lián)邦監(jiān)管之下，此舉或?qū)⒁l(fā)對谷歌類似于對銀行的例行檢查和監(jiān)控。 CFPB指出，該決定源于對谷歌支付業(yè)務(wù)的審…

Google
2024年12月8日
手機(jī)

谷歌將Pixel系列更新時(shí)間延長至五年

近日，谷歌對Pixel系列用戶宣布，Pixel 6、Pixel 7以及原始Pixel Fold等設(shè)備將獲得五年的操作系統(tǒng)支持和安全更新。此前，谷歌承諾的是三年操作系統(tǒng)支持和五年安全…

Google
2024年12月6日
出海

如何提升Shopify商店流量？新手賣家的SEO優(yōu)化指南

在電商領(lǐng)域，流量就是基礎(chǔ)，對于即將或已經(jīng)進(jìn)入跨境電商的Shopify新手賣家來說，如何在谷歌的自然搜索結(jié)果中獲得靠前的排名，從而吸引更多潛在客戶，是一個(gè)至關(guān)重要的問題。下面小編將為…

秋秋
2024年12月5日
新聞

傳聞谷歌Chrome瀏覽器任務(wù)管理器將迎重大更新

據(jù)外媒昨日報(bào)道，谷歌計(jì)劃為Windows 10和Windows 11版本的Chrome瀏覽器推出一次重要更新，此次更新的重點(diǎn)是內(nèi)置的任務(wù)管理器。據(jù)了解，全新版本的Chrome瀏覽…

Google
2024年11月29日

發(fā)表回復(fù)

登錄后才能評論

谷歌推出全能視頻編碼器VideoPrism 性能超越30項(xiàng)SOTA

相關(guān)推薦

發(fā)表回復(fù)