Meta周日發(fā)布Llama 4,最強(qiáng)開源模型組隊(duì)殺入AI戰(zhàn)場(chǎng)

Meta周日發(fā)布Llama 4,最強(qiáng)開源模型組隊(duì)殺入AI戰(zhàn)場(chǎng)

當(dāng)?shù)貢r(shí)間4月6日,Meta硅谷周末的平靜中突然投下AI核彈。這家科技巨頭在官網(wǎng)及開發(fā)者社區(qū)同步上線Llama 4系列,包含Scout、Maverick兩款即時(shí)可用模型,以及預(yù)告中的Behemoth模型。這是Meta首個(gè)基于混合專家(MoE)架構(gòu)的開源模型家族,扎克伯格稱前兩款為”目前最先進(jìn)的多模態(tài)型號(hào)”。?
Llama 4 Scout以16位專家架構(gòu)實(shí)現(xiàn)170億激活參數(shù),單個(gè)H100 GPU即可運(yùn)行,同時(shí)具備1000萬(wàn)token上下文窗口。其多模態(tài)訓(xùn)練數(shù)據(jù)涵蓋30萬(wàn)億token的文本、圖像及視頻資源,視覺(jué)理解能力獲官方重點(diǎn)推介。更引人注目的是Llama 4 Maverick,采用128位專家架構(gòu)的同參數(shù)規(guī)模設(shè)計(jì),在代碼能力上與DeepSeek-V3持平,但參數(shù)效率提升50%。實(shí)測(cè)顯示該模型在文本推理、數(shù)學(xué)運(yùn)算等場(chǎng)景超越GPT-4o和Gemini 2.0 Flash。?
雖然最高規(guī)格的Behemoth仍在訓(xùn)練,Meta已披露其作為”新模型教師”的特殊定位。該模型使用16000塊H100 GPU集群訓(xùn)練,能源消耗是前代的2.3倍,目標(biāo)直指多模態(tài)數(shù)據(jù)清洗難題。目前Scout與Maverick已登陸Hugging Face等平臺(tái),Meta AI助手同步在40國(guó)更新至Llama 4版本,但多模態(tài)功能暫限美區(qū)英語(yǔ)用戶。

此次發(fā)布被視作對(duì)DeepSeek等中國(guó)AI公司的直接回應(yīng)。據(jù)開發(fā)者論壇消息,Meta內(nèi)部曾組建特別小組研究DeepSeek-V3的成本控制方案。隨著Llama 4入局,全球開源模型競(jìng)賽進(jìn)入白熱化階段,Meta計(jì)劃在4月29日舉辦首屆LlamaCon大會(huì),并預(yù)告第二季度推出獨(dú)立版AI助手應(yīng)用。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/713821.html

AI的頭像AI認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論