阿里云通義千問發(fā)布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens長(zhǎng)上下文

AI ? 2024年6月7日 16:26:00 ? AI

今日，阿里云通義千問（Qwen）宣布，經(jīng)過數(shù)月的持續(xù)研發(fā)和優(yōu)化，其AI開源模型系列已升級(jí)至Qwen2，并在Hugging Face和ModelScope上同步開源。此次升級(jí)不僅引入了五個(gè)尺寸的預(yù)訓(xùn)練和指令微調(diào)模型，還在多項(xiàng)性能上實(shí)現(xiàn)了顯著提升，包括代碼和數(shù)學(xué)能力的增強(qiáng)，以及對(duì)更長(zhǎng)上下文長(zhǎng)度的支持。

Qwen2系列包括五個(gè)不同尺寸的模型：Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B，這些模型在參數(shù)量、非Embedding參數(shù)量以及上下文長(zhǎng)度上均有所不同，以滿足不同場(chǎng)景下的需求。特別值得一提的是，Qwen2-72B-Instruct模型的上下文長(zhǎng)度支持最高達(dá)到了128K tokens，為用戶提供了更加廣闊的文本處理空間。

在訓(xùn)練數(shù)據(jù)方面，Qwen2系列在中文和英語的基礎(chǔ)上，增加了27種語言相關(guān)的高質(zhì)量數(shù)據(jù)，從而大幅提升了模型的多語言能力。同時(shí)，所有尺寸的模型都采用了GQA（Gradient-based Quantization Aware Training）技術(shù)，該技術(shù)能夠顯著加速推理過程并降低顯存占用，為用戶提供更加高效和穩(wěn)定的模型使用體驗(yàn)。

在模型評(píng)測(cè)方面，Qwen2系列在大規(guī)模模型上實(shí)現(xiàn)了非常大幅度的效果提升。尤其是Qwen2-72B模型，在包括自然語言理解、知識(shí)、代碼、數(shù)學(xué)及多語言等多項(xiàng)能力上均顯著超越當(dāng)前領(lǐng)先的模型，如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。這一成果充分展示了Qwen2系列在AI模型研發(fā)領(lǐng)域的領(lǐng)先地位和強(qiáng)大實(shí)力。

阿里云通義千問作為阿里云旗下的AI開源項(xiàng)目，一直致力于推動(dòng)AI技術(shù)的創(chuàng)新和發(fā)展。此次Qwen2系列的發(fā)布，不僅為用戶提供了更加先進(jìn)和高效的AI模型，也進(jìn)一步彰顯了阿里云在AI領(lǐng)域的技術(shù)實(shí)力和創(chuàng)新能力。未來，我們期待通義千問能夠繼續(xù)推出更多優(yōu)秀的AI模型和技術(shù)，為AI領(lǐng)域的發(fā)展貢獻(xiàn)更多的力量。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請(qǐng)注明出處：http://2079x.cn/article/659662.html

Qwen2 通義千問阿里云阿里云通義千問

AI認(rèn)證作者

0 0

新聞

馬云低調(diào)現(xiàn)身阿里云谷園區(qū)，身穿15周年紀(jì)念T恤佩戴新工牌

有消息稱，阿里巴巴創(chuàng)始人馬云被曝現(xiàn)身杭州阿里云谷園區(qū)。多位網(wǎng)友曬出照片顯示，馬云身穿純白色T恤，胸口處印有“Alibaba Cloud 15th Anniversay since …

小科同學(xué)
2025年4月10日
AI

傳聞阿里Qwen3模型將于4月發(fā)布，直面DeepSeek挑戰(zhàn)沖擊”最強(qiáng)AI”寶座

據(jù)媒體披露，阿里云計(jì)劃于2025年4月第二周正式發(fā)布新一代大模型Qwen3，這將成為該集團(tuán)上半年最重磅的AI技術(shù)產(chǎn)品。內(nèi)部文件顯示，在2024年Qwen2.5版本發(fā)布后，研發(fā)團(tuán)隊(duì)已…

AI
2025年4月2日
AI

Manus聯(lián)手阿里通義千問，國(guó)產(chǎn)大模型首度實(shí)現(xiàn)全功能遷移

今日，AI公司Manus合伙人張濤宣布，與阿里云通義千問團(tuán)隊(duì)達(dá)成戰(zhàn)略合作，雙方將基于通義千問開源模型，在國(guó)產(chǎn)化算力平臺(tái)上實(shí)現(xiàn)Manus產(chǎn)品的全功能適配，為中國(guó)用戶打造更高效、更具創(chuàng)…

AI
2025年3月12日
AI

?阿里開源通義千問QwQ-32B：高能推理+低成本部署

近日，阿里巴巴正式發(fā)布并開源全新推理模型?通義千問QwQ-32B?，主打“高性能+低門檻”特性。該模型基于320億參數(shù)規(guī)模，在數(shù)學(xué)推理、代碼生成及通用任務(wù)中表現(xiàn)亮眼，綜合性能對(duì)標(biāo)D…

AI
2025年3月7日
AI

阿里發(fā)布開源模型QwQ-32B，消費(fèi)級(jí)顯卡實(shí)現(xiàn)滿血版性能

3月6日上午消息，阿里巴巴官宣發(fā)布并開源全新的推理模型通義千問QwQ-32B。通過大規(guī)模強(qiáng)化學(xué)習(xí)，千問QwQ-32B在數(shù)學(xué)、代碼及通用能力上實(shí)現(xiàn)質(zhì)的飛躍，整體性能比肩DeepSeek-R1。

科技探索者
2025年3月6日
出海

阿里云墨西哥數(shù)據(jù)中心開服，拉美云服務(wù)市場(chǎng)迎來新篇章

今日，云計(jì)算領(lǐng)域的巨頭阿里云宣布了一個(gè)令人振奮的消息：其墨西哥數(shù)據(jù)中心正式投入運(yùn)營(yíng)！這不僅標(biāo)志著阿里云在拉美區(qū)域邁出了堅(jiān)實(shí)的第一步，更預(yù)示著它將為南美市場(chǎng)帶來全新的變革。據(jù)悉，這…

李小白
2025年2月19日
新聞

阿里云盤的“隱形收費(fèi)”：用戶信任的崩塌與平臺(tái)的失責(zé)

近年來，隨著云存儲(chǔ)服務(wù)的普及，阿里云盤作為國(guó)內(nèi)頭部云服務(wù)商，憑借其大容量和高速傳輸?shù)膬?yōu)勢(shì)，吸引了大量用戶。然而，近期多名用戶在黑貓投訴平臺(tái)反映，阿里云盤的會(huì)員服務(wù)存在“自動(dòng)續(xù)費(fèi)無顯…

NEWS
2025年2月14日
新聞

阿里云官宣DeepSeek模型一鍵部署，R1與V3版本云上輕松獲取

昨日，阿里云計(jì)算有限公司在其官方平臺(tái)宣布，阿里云PAI Model Gallery現(xiàn)已支持DeepSeek-V3與DeepSeek-R1模型的一鍵部署功能。這一消息標(biāo)志著DeepS…

野游栗
2025年2月4日
新聞

UALink聯(lián)盟新增成員：蘋果、阿里云與新思科技強(qiáng)勢(shì)加盟

近日，UALink聯(lián)盟宣布迎來新成員——阿里云、蘋果和新思科技（Synopsys）正式加入其董事會(huì)。據(jù)了解，UALink聯(lián)盟自2024年10月由AMD、亞馬遜AWS等9家企業(yè)發(fā)起成…

NEWS
2025年1月15日
新聞

雷鳥創(chuàng)新與阿里云達(dá)成戰(zhàn)略合作，引領(lǐng) AI大模型與AR眼鏡融合新紀(jì)元

雷鳥創(chuàng)新與阿里云達(dá)成AI眼鏡獨(dú)家戰(zhàn)略合作，阿里云通義大模型提供技術(shù)支持。雙方將共同研發(fā)，提升AI眼鏡交互體驗(yàn)。雷鳥V3AI拍攝眼鏡將搭載定制大模型亮相，智能眼鏡或成AI重要橋梁。

潮玩君
2025年1月3日
出海

全球公有云平臺(tái)Wave評(píng)估報(bào)告發(fā)布阿里云全球排名第二

近日，全球權(quán)威研究機(jī)構(gòu)Forrester發(fā)布了其最新的公有云平臺(tái)Wave評(píng)估報(bào)告，全面評(píng)估了全球主要公有云廠商的技術(shù)能力與戰(zhàn)略布局。根據(jù)評(píng)估結(jié)果，阿里云與亞馬遜AWS、微軟Azur…

科技探索者
2024年12月4日
出海

阿里云發(fā)布全新國(guó)際生態(tài)伙伴計(jì)劃，激勵(lì)合作伙伴推動(dòng)技術(shù)創(chuàng)新

昨日，阿里云正式對(duì)外宣布了全新國(guó)際生態(tài)伙伴計(jì)劃，旨在攜手全球合作伙伴共同推動(dòng)云計(jì)算和人工智能技術(shù)的創(chuàng)新與發(fā)展。據(jù)悉，該計(jì)劃出臺(tái)了一系列激勵(lì)政策，以吸引更多的技術(shù)伙伴加入。其中，阿…

李小白
2024年12月4日
新聞

阿里云加大香港市場(chǎng)投入，推出“香港科技創(chuàng)未來”計(jì)劃

昨日，阿里云宣布將加大香港市場(chǎng)投入，推出“香港科技創(chuàng)未來”計(jì)劃。并增強(qiáng)對(duì)本土企業(yè)和上臺(tái)伙伴的AI技術(shù)支持和人才培育。作為香港排名第一的云計(jì)算IaaS服務(wù)提供商，阿里云營(yíng)收保持雙位…

李森
2024年11月28日
商業(yè)

阿里集團(tuán)CEO吳泳銘：AI最大的想象力在于改變物理世界

阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長(zhǎng)兼CEO吳泳銘：“?過去22個(gè)月，AI發(fā)展速度超過任何歷史時(shí)期，但我們依然還處于AGI變革的早期。生成式AI最大的想象力，絕不是在手機(jī)屏幕上做一兩個(gè)新的超級(jí)app，而是接管數(shù)字世界，改變物理世界。”

藍(lán)鯊財(cái)經(jīng)社
2024年9月21日
AI

阿里通義千問開源Qwen2-Audio 7B：無需文本自由對(duì)話

近日，阿里巴巴通義千問團(tuán)隊(duì)宣布開源了其最新的音頻語言模型Qwen2-Audio系列，包括Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct兩個(gè)版本。這一大…

AI
2024年8月13日
AI

阿里云開源大模型Qwen2-72B登頂Hugging Face新排行榜

近日，人工智能領(lǐng)域傳來喜訊，阿里巴巴集團(tuán)開源的通義千問（Qwen）指令微調(diào)模型Qwen2-72B在Hugging Face公布的全新開源大語言模型排行榜上榮登榜首，成功超越Meta…

AI
2024年6月30日
AI

百度文心大模型ENIRE Speed和ENIRE Lite全面免費(fèi)，加速AI應(yīng)用普及

在人工智能領(lǐng)域的激烈競(jìng)爭(zhēng)中，百度文心大模型近日宣布了一項(xiàng)重磅消息：其兩款主力模型ENIRE Speed和ENIRE Lite將全面免費(fèi)開放使用，即刻生效。這一舉措無疑將對(duì)整個(gè)行業(yè)產(chǎn)…

百度
2024年5月21日
AI

阿里云發(fā)布通義千問2.5大模型，能力全面升級(jí)，趕超GPT-4

昨日，在阿里云AI智領(lǐng)者峰會(huì)-北京站活動(dòng)中，阿里云正式發(fā)布了通義千問2.5大模型，并宣稱其在多項(xiàng)能力上已全面趕超GPT-4，尤其在中文語境下的表現(xiàn)尤為突出。據(jù)阿里云官方介紹，通義…

科技新聞
2024年5月10日
AI

阿里云通義千問開源320億參數(shù)大語言模型，全系列已達(dá)七款

4月7日，阿里云宣布通義千問成功開源其最新的320億參數(shù)大語言模型——Qwen1.5-32B，至此通義千問已完成包括5億、18億、40億、70億、140億和720億參數(shù)在內(nèi)的全系列…

科技新聞
2024年4月8日
AI

阿里云啟用AI編程助手通義靈碼，助力程序員提升效率

近日，阿里云在內(nèi)部全面推行AI編程，借助通義靈碼這一智能編程助手，幫助程序員編寫代碼、閱讀代碼、檢查BUG以及優(yōu)化代碼等工作。這一創(chuàng)新舉措標(biāo)志著阿里云在智能化編程領(lǐng)域邁出了重要的一…

泡沫大盜
2024年4月3日