阿里通義開源模型Qwen2.5進(jìn)入大模型盲測全球前十

基準(zhǔn)測試平臺Chatbot Arena發(fā)布了最新的大模型盲測排名。10天前發(fā)布的阿里通義千問開源模型Qwen2.5再次闖入全球十強,其Qwen2.5-72B-Instruct大語言模型在榜單中位列第十,是前十名中唯一的中國模型。此外,通義千問的視覺語言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的開源大模型。

近日,基準(zhǔn)測試平臺Chatbot Arena發(fā)布了最新的大模型盲測排名。10天前發(fā)布的阿里通義千問開源模型Qwen2.5再次闖入全球十強,其Qwen2.5-72B-Instruct大語言模型在榜單中位列第十,是前十名中唯一的中國模型。此外,通義千問的視覺語言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的開源大模型。

阿里通義開源模型Qwen2.5進(jìn)入大模型盲測全球前十

與此同時,基于Qwen系列的衍生模型在全球開源社區(qū)中的數(shù)量已突破7.43萬,超過了Llama系列的7.28萬,成為全球最大的生成式語言模型家族。在Hugging Face社區(qū)的開源模型排行榜Open LLM Leaderboard上,Qwen系列及其衍生模型包攬了前十全部座次。

Chatbot Arena由開放研究機(jī)構(gòu)LMSYS Org推出,是目前全球頂尖的大模型測試平臺。平臺目前集成了全球70多個大模型,采用匿名方式將大模型兩兩組隊,交給用戶進(jìn)行盲測,用戶根據(jù)真實對話體驗對模型能力進(jìn)行投票。

原創(chuàng)文章,作者:潮玩君,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/684168.html

潮玩君的頭像潮玩君管理團(tuán)隊

相關(guān)推薦

  • 超越GPT-4 Claude 3超大杯成新王

    Claude 3 Opus在Chatbot Arena的聊天機(jī)器人對戰(zhàn)排行榜中反超GPT-4,成為新冠軍,且Claude 3家族整體表現(xiàn)亮眼。Chatbot Arena榜單權(quán)威,基于真實人類用戶體驗打分。Claude 3因其勤奮和低成本受到好評,尤其Claude 3 Haiku能以低成本即時運行并提供高智能客戶服務(wù)。相比之下,ChatGPT被指在過去一年中零增長,面臨競爭壓力,垂直化AI初創(chuàng)公司正滿足用戶需求。ChatGPT未來可能以平臺專屬模型為特色,成為新的增長點。

    2024年3月28日

發(fā)表回復(fù)

登錄后才能評論