谷歌上線“省錢版”AI模型,Gemini 2.5 Flash主攻實(shí)時(shí)場(chǎng)景

谷歌上線“省錢版”AI模型,Gemini 2.5 Flash主攻實(shí)時(shí)場(chǎng)景

今日,谷歌正式推出全新AI模型Gemini 2.5 Flash,定位為“高性價(jià)比推理工具”,主打低成本實(shí)時(shí)響應(yīng)能力。該模型即日起開放測(cè)試,并將率先登陸谷歌AI開發(fā)平臺(tái)Vertex AI。?
谷歌在技術(shù)博客中介紹,Gemini 2.5 Flash支持動(dòng)態(tài)調(diào)節(jié)算力,開發(fā)者可根據(jù)任務(wù)復(fù)雜度靈活分配處理時(shí)間。例如處理簡(jiǎn)單客服咨詢時(shí),系統(tǒng)自動(dòng)縮短響應(yīng)耗時(shí)以降低計(jì)費(fèi)成本;面對(duì)復(fù)雜文檔解析則延長(zhǎng)計(jì)算精度。谷歌稱該特性可將綜合成本壓縮至旗艦?zāi)P虶emini 2.5 Pro的50%,適用于需高頻調(diào)用AI的銀行、電信等行業(yè)。?
與OpenAI的o3-mini、深度求索的R1類似,Gemini 2.5 Flash被歸類為“推理優(yōu)化模型”,在回答前需執(zhí)行事實(shí)校驗(yàn),響應(yīng)時(shí)間較生成式模型略長(zhǎng)。但其平均延遲控制在0.8秒內(nèi),適配智能客服、會(huì)議紀(jì)要生成等實(shí)時(shí)場(chǎng)景。谷歌特別提到,該模型已應(yīng)用于內(nèi)部郵件摘要工具,單日處理量超200萬條。?
谷歌同步宣布,自2024年第三季度起,企業(yè)可通過谷歌分布式云(GDC)在自有服務(wù)器部署Gemini系列模型。目前正與英偉達(dá)合作適配Blackwell架構(gòu)硬件,客戶可通過谷歌或合作渠道采購搭載該芯片的本地算力設(shè)備,滿足金融、醫(yī)療等敏感數(shù)據(jù)行業(yè)的合規(guī)需求。?
值得注意的是,谷歌未披露Gemini 2.5 Flash的技術(shù)白皮書及安全測(cè)試結(jié)果。公司解釋稱,對(duì)于定義為“實(shí)驗(yàn)性”的模型暫不發(fā)布詳細(xì)報(bào)告,但承諾已通過內(nèi)部倫理審查。此前Gemini 1.5 Pro因圖像生成偏差引發(fā)爭(zhēng)議,此次策略調(diào)整引發(fā)開發(fā)者社區(qū)對(duì)模型透明度的討論。

據(jù)Vertex AI后臺(tái)數(shù)據(jù)顯示,Gemini 2.5 Flash開放測(cè)試3小時(shí)內(nèi),已有超過1.2萬家企業(yè)申請(qǐng)接入,其中63%來自客戶服務(wù)、文檔管理領(lǐng)域。谷歌計(jì)劃在9月前完成首批企業(yè)用戶的模型部署。

原創(chuàng)文章,作者:Google,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/714290.html

Google的頭像Google認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論