阿里云通義千問多模態(tài)大模型Qwen-VL-Max重磅升級

若安丶 ? 2024年1月27日 20:28:00 ? AI

阿里云昨日公布了其多模態(tài)大模型研究的新進(jìn)展，推出了升級版的通義千問視覺理解模型Qwen-VL-Max。這款模型在視覺推理能力和中文理解能力上都有了顯著提升，性能表現(xiàn)堪比GPT-4V和谷歌的Gemini Ultra。

Qwen-VL-Max的升級主要表現(xiàn)在以下幾個方面：

基礎(chǔ)能力：Qwen-VL-Max能夠準(zhǔn)確描述和識別圖片信息，并基于圖片進(jìn)行信息推理和擴(kuò)展創(chuàng)作。它還具備了視覺定位能力，能夠?qū)Ξ嬅嬷付▍^(qū)域進(jìn)行問答。
視覺推理：新版模型能夠理解流程圖等復(fù)雜形式圖片，并能夠分析復(fù)雜圖標(biāo)。此外，它在看圖做題、看圖作文以及看圖寫代碼等任務(wù)上也達(dá)到了世界最佳水平。
圖像文本處理：Qwen-VL-Max的中英文文本識別能力顯著提高，支持百萬像素以上的高清分辨率圖和極端寬高比的圖像。它既能夠完整復(fù)現(xiàn)密集文本，也能從表格和文檔中提取信息。

與LLM（大語言模型）相比，多模態(tài)大模型擁有更大的應(yīng)用想象力。例如，研究者正在探索將多模態(tài)大模型與自動駕駛場景結(jié)合，為“完全自動駕駛”找到新的技術(shù)路徑。此外，將多模態(tài)模型部署到手機、機器人、智能音箱等端側(cè)設(shè)備，可以讓智能設(shè)備自動理解物理世界的信息，或者基于多模態(tài)模型開發(fā)應(yīng)用，輔助視力障礙群體的日常生活等等。

Qwen-VL-Plus和Qwen-VL-Max目前限時免費，用戶可以在通義千問官網(wǎng)、通義千問APP直接體驗Max版本模型的能力，也可以通過阿里云靈積平臺（DashScope）調(diào)用模型API。

總的來說，阿里云的通義千問多模態(tài)大模型Qwen-VL-Max在視覺推理和中文理解方面都展現(xiàn)出了強大的實力，其性能表現(xiàn)足以與GPT-4V和谷歌的Gemini Ultra相媲美。這將為用戶提供更豐富、更準(zhǔn)確的視覺信息理解和創(chuàng)作能力，推動AI技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。

原創(chuàng)文章，作者：若安丶，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/624926.html

Qwen-VL-Max Qwen-VL-Max升級通義千問多模態(tài)大模型Qwen-VL-Max 通義千問多模態(tài)大模型Qwen-VL-Max升級阿里云

若安丶管理團(tuán)隊

0 0

新聞

馬云低調(diào)現(xiàn)身阿里云谷園區(qū)，身穿15周年紀(jì)念T恤佩戴新工牌

有消息稱，阿里巴巴創(chuàng)始人馬云被曝現(xiàn)身杭州阿里云谷園區(qū)。多位網(wǎng)友曬出照片顯示，馬云身穿純白色T恤，胸口處印有“Alibaba Cloud 15th Anniversay since …

小科同學(xué)
2025年4月10日
AI

傳聞阿里Qwen3模型將于4月發(fā)布，直面DeepSeek挑戰(zhàn)沖擊”最強AI”寶座

據(jù)媒體披露，阿里云計劃于2025年4月第二周正式發(fā)布新一代大模型Qwen3，這將成為該集團(tuán)上半年最重磅的AI技術(shù)產(chǎn)品。內(nèi)部文件顯示，在2024年Qwen2.5版本發(fā)布后，研發(fā)團(tuán)隊已…

AI
2025年4月2日
AI

Manus聯(lián)手阿里通義千問，國產(chǎn)大模型首度實現(xiàn)全功能遷移

今日，AI公司Manus合伙人張濤宣布，與阿里云通義千問團(tuán)隊達(dá)成戰(zhàn)略合作，雙方將基于通義千問開源模型，在國產(chǎn)化算力平臺上實現(xiàn)Manus產(chǎn)品的全功能適配，為中國用戶打造更高效、更具創(chuàng)…

AI
2025年3月12日
出海

阿里云墨西哥數(shù)據(jù)中心開服，拉美云服務(wù)市場迎來新篇章

今日，云計算領(lǐng)域的巨頭阿里云宣布了一個令人振奮的消息：其墨西哥數(shù)據(jù)中心正式投入運營！這不僅標(biāo)志著阿里云在拉美區(qū)域邁出了堅實的第一步，更預(yù)示著它將為南美市場帶來全新的變革。據(jù)悉，這…

李小白
2025年2月19日
新聞

阿里云盤的“隱形收費”：用戶信任的崩塌與平臺的失責(zé)

近年來，隨著云存儲服務(wù)的普及，阿里云盤作為國內(nèi)頭部云服務(wù)商，憑借其大容量和高速傳輸?shù)膬?yōu)勢，吸引了大量用戶。然而，近期多名用戶在黑貓投訴平臺反映，阿里云盤的會員服務(wù)存在“自動續(xù)費無顯…

NEWS
2025年2月14日
新聞

阿里云官宣DeepSeek模型一鍵部署，R1與V3版本云上輕松獲取

昨日，阿里云計算有限公司在其官方平臺宣布，阿里云PAI Model Gallery現(xiàn)已支持DeepSeek-V3與DeepSeek-R1模型的一鍵部署功能。這一消息標(biāo)志著DeepS…

野游栗
2025年2月4日
新聞

UALink聯(lián)盟新增成員：蘋果、阿里云與新思科技強勢加盟

近日，UALink聯(lián)盟宣布迎來新成員——阿里云、蘋果和新思科技（Synopsys）正式加入其董事會。據(jù)了解，UALink聯(lián)盟自2024年10月由AMD、亞馬遜AWS等9家企業(yè)發(fā)起成…

NEWS
2025年1月15日
新聞

雷鳥創(chuàng)新與阿里云達(dá)成戰(zhàn)略合作，引領(lǐng) AI大模型與AR眼鏡融合新紀(jì)元

雷鳥創(chuàng)新與阿里云達(dá)成AI眼鏡獨家戰(zhàn)略合作，阿里云通義大模型提供技術(shù)支持。雙方將共同研發(fā)，提升AI眼鏡交互體驗。雷鳥V3AI拍攝眼鏡將搭載定制大模型亮相，智能眼鏡或成AI重要橋梁。

潮玩君
2025年1月3日
出海

全球公有云平臺Wave評估報告發(fā)布阿里云全球排名第二

近日，全球權(quán)威研究機構(gòu)Forrester發(fā)布了其最新的公有云平臺Wave評估報告，全面評估了全球主要公有云廠商的技術(shù)能力與戰(zhàn)略布局。根據(jù)評估結(jié)果，阿里云與亞馬遜AWS、微軟Azur…

科技探索者
2024年12月4日
出海

阿里云發(fā)布全新國際生態(tài)伙伴計劃，激勵合作伙伴推動技術(shù)創(chuàng)新

昨日，阿里云正式對外宣布了全新國際生態(tài)伙伴計劃，旨在攜手全球合作伙伴共同推動云計算和人工智能技術(shù)的創(chuàng)新與發(fā)展。據(jù)悉，該計劃出臺了一系列激勵政策，以吸引更多的技術(shù)伙伴加入。其中，阿…

李小白
2024年12月4日
新聞

阿里云加大香港市場投入，推出“香港科技創(chuàng)未來”計劃

昨日，阿里云宣布將加大香港市場投入，推出“香港科技創(chuàng)未來”計劃。并增強對本土企業(yè)和上臺伙伴的AI技術(shù)支持和人才培育。作為香港排名第一的云計算IaaS服務(wù)提供商，阿里云營收保持雙位…

李森
2024年11月28日
商業(yè)

阿里集團(tuán)CEO吳泳銘：AI最大的想象力在于改變物理世界

阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長兼CEO吳泳銘：“?過去22個月，AI發(fā)展速度超過任何歷史時期，但我們依然還處于AGI變革的早期。生成式AI最大的想象力，絕不是在手機屏幕上做一兩個新的超級app，而是接管數(shù)字世界，改變物理世界。”

藍(lán)鯊財經(jīng)社
2024年9月21日
AI

阿里云通義千問發(fā)布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens長上下文

今日，阿里云通義千問（Qwen）宣布，經(jīng)過數(shù)月的持續(xù)研發(fā)和優(yōu)化，其AI開源模型系列已升級至Qwen2，并在Hugging Face和ModelScope上同步開源。此次升級不僅引入…

AI
2024年6月7日
AI

百度文心大模型ENIRE Speed和ENIRE Lite全面免費，加速AI應(yīng)用普及

在人工智能領(lǐng)域的激烈競爭中，百度文心大模型近日宣布了一項重磅消息：其兩款主力模型ENIRE Speed和ENIRE Lite將全面免費開放使用，即刻生效。這一舉措無疑將對整個行業(yè)產(chǎn)…

百度
2024年5月21日
AI

阿里云發(fā)布通義千問2.5大模型，能力全面升級，趕超GPT-4

昨日，在阿里云AI智領(lǐng)者峰會-北京站活動中，阿里云正式發(fā)布了通義千問2.5大模型，并宣稱其在多項能力上已全面趕超GPT-4，尤其在中文語境下的表現(xiàn)尤為突出。據(jù)阿里云官方介紹，通義…

科技新聞
2024年5月10日
AI

阿里云通義千問開源320億參數(shù)大語言模型，全系列已達(dá)七款

4月7日，阿里云宣布通義千問成功開源其最新的320億參數(shù)大語言模型——Qwen1.5-32B，至此通義千問已完成包括5億、18億、40億、70億、140億和720億參數(shù)在內(nèi)的全系列…

科技新聞
2024年4月8日
AI

阿里云啟用AI編程助手通義靈碼，助力程序員提升效率

近日，阿里云在內(nèi)部全面推行AI編程，借助通義靈碼這一智能編程助手，幫助程序員編寫代碼、閱讀代碼、檢查BUG以及優(yōu)化代碼等工作。這一創(chuàng)新舉措標(biāo)志著阿里云在智能化編程領(lǐng)域邁出了重要的一…

泡沫大盜
2024年4月3日
新聞

阿里云宣布通義千問720億參數(shù)模型開源

今日，阿里云宣布開源通義千問 720 億參數(shù)模型 Qwen-72B、18 億參數(shù)模型 Qwen-1.8B 及音頻大模型 Qwen-Audio，目前已上線阿里魔搭社區(qū)。

秋秋
2023年12月1日
新聞

阿里巴巴：吳泳銘接替張勇，阿里云智能集團(tuán)分拆計劃繼續(xù)進(jìn)行

阿里巴巴宣布吳泳銘先生將接替張勇先生出任阿里云智能集團(tuán)代理董事長兼首席執(zhí)行官，委任于 2023 年 9 月 10 日生效

科技探索者
2023年9月11日
張勇發(fā)全員信：阿里云將分拆上市

阿里巴巴宣布啟動「1+6+N」組織變革以來，首個正式宣布「單飛」的業(yè)務(wù)落子阿里云智能集團(tuán)

蘋果派
新聞 2023年5月19日

發(fā)表回復(fù)

登錄后才能評論

阿里云通義千問多模態(tài)大模型Qwen-VL-Max重磅升級

相關(guān)推薦

發(fā)表回復(fù)

分享到: