?字節(jié)跳動(dòng)豆包1.5模型發(fā)布:看圖思考、視頻找答案全能升級(jí)

?字節(jié)跳動(dòng)豆包1.5模型發(fā)布:看圖思考、視頻找答案全能升級(jí)

在近日的火山引擎AI創(chuàng)新巡展杭州站上,字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布豆包1.5深度思考模型。這款多模態(tài)大模型在數(shù)學(xué)推理、編程競(jìng)賽、科學(xué)分析等專(zhuān)業(yè)領(lǐng)域表現(xiàn)突出,其數(shù)學(xué)能力追平OpenAI o3-mini-high,編程與科學(xué)測(cè)試成績(jī)接近o1模型水平,創(chuàng)意寫(xiě)作與人文知識(shí)問(wèn)答同樣展現(xiàn)廣泛適用性。

技術(shù)細(xì)節(jié)顯示,豆包1.5采用MoE混合專(zhuān)家架構(gòu),總參數(shù)達(dá)2000億,激活參數(shù)僅200億,較同類(lèi)模型減少50%計(jì)算資源消耗。其API服務(wù)響應(yīng)延遲低至20毫秒,支持每秒數(shù)萬(wàn)次高并發(fā)調(diào)用,顯著降低企業(yè)使用成本。更引人注目的是,該模型整合視覺(jué)理解技術(shù),能通過(guò)照片分析地質(zhì)構(gòu)造,旅行時(shí)實(shí)時(shí)翻譯菜單并推薦菜品,甚至輔助企業(yè)繪制項(xiàng)目管理流程圖。

同步開(kāi)放的文生圖模型Seedream3.0已登陸即夢(mèng)AI與豆包平臺(tái),支持2K高清圖像直出,在權(quán)威評(píng)測(cè)平臺(tái)Artificial Analysis中躋身第一梯隊(duì)。該模型在構(gòu)圖精準(zhǔn)度、文字排版、畫(huà)面真實(shí)感等方面表現(xiàn)優(yōu)異,企業(yè)用戶(hù)可即刻調(diào)用其創(chuàng)作能力。

視頻搜索功能升級(jí)成為另一亮點(diǎn)。豆包1.5可精準(zhǔn)定位視頻片段,根據(jù)用戶(hù)問(wèn)題提取對(duì)應(yīng)畫(huà)面與語(yǔ)音信息,例如在科普視頻中快速檢索實(shí)驗(yàn)步驟。

譚待同時(shí)披露,豆包大模型生態(tài)發(fā)展迅猛。截至2025年3月,其日均Tokens處理量突破12.7萬(wàn)億,較初期暴增106倍,覆蓋辦公、教育、娛樂(lè)等多元場(chǎng)景。目前,火山引擎已向企業(yè)開(kāi)放豆包系列模型API接口,開(kāi)發(fā)者可通過(guò)火山方舟平臺(tái)接入測(cè)試。

此次升級(jí)標(biāo)志著字節(jié)跳動(dòng)在通用AI領(lǐng)域邁出關(guān)鍵一步。隨著多模態(tài)技術(shù)持續(xù)突破,豆包模型正加速滲透至產(chǎn)業(yè)應(yīng)用端,為智能服務(wù)提供更強(qiáng)大的底層支撐。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/715297.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論