直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

7月6日,在2024 世界人工智能大會“智啟文創(chuàng)-激發(fā)無限新質(zhì)生產(chǎn)力”論壇(簡稱“WAIC 2024”)上,智象未來聯(lián)合創(chuàng)始人兼CTO姚霆博士,發(fā)布了“智象大模型2.0”升級版。

直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

“智象大模型2.0”在繼承了1.0版本對文本、圖像、視頻和3D元素聯(lián)合建模能力的基礎(chǔ)上,2.0版本在多個方面進行了顯著的性能提升。“智象大模型”自2023年8月上市以來,憑借其友好的操作界面、卓越的成像效果以及便捷的應(yīng)用性,被推崇為大眾使用首選的AIGC大模型應(yīng)用平臺。

姚霆博士介紹,本次2.0提升方向可概括為三點:圖像美、視頻長、質(zhì)量高。

直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

圖像美:文生圖,是AIGC產(chǎn)品應(yīng)用的基礎(chǔ),是智象大模型的行業(yè)突出優(yōu)勢。在文生圖的應(yīng)用板塊中,“智象大模型2.0”展現(xiàn)了其卓越的圖像生成能力,尤其在處理長文本輸入時,模型不僅能夠深入理解文本內(nèi)容,還能將這些內(nèi)容轉(zhuǎn)化為具有高度視覺藝術(shù)性的圖像。值得一提的是,“智象大模型 2.0” 還增添了「文字嵌入生成」的能力。這意味著它不僅在單一的文生圖方面,能夠生成更為優(yōu)質(zhì)和復(fù)雜的圖像。而且對于長文本輸入中,需要在畫面里呈現(xiàn)的文字,也能夠精準識別,并進行設(shè)計與表達。使得文字和圖像的結(jié)合更加自然和諧,從而提升了成像的整體質(zhì)量和表現(xiàn)力。

直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

視頻長:在視頻生成領(lǐng)域,“智象大模型2.0”在保持4K高畫質(zhì)的基礎(chǔ)上,實現(xiàn)了視頻畫面的運動更加流暢自然。7月中旬平臺將面向大眾提供5、10、15秒三種視頻生成時長,和多種視頻常規(guī)應(yīng)用尺寸的搭配組合,并且在商業(yè)化應(yīng)用中提供分鐘級的連貫性視頻內(nèi)容。在現(xiàn)場演示環(huán)節(jié)中,其震撼的視頻成像能力瞬間引爆全場!

直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

質(zhì)量高:在故事性視頻生成領(lǐng)域,“智象大模型2.0”支持劇本多鏡頭視頻生成、IP連貫一致性等功能特性,本次升級面向行業(yè)提供文生Vision Pro場景下的3D生成與編輯功能,3D編輯將在多場景下實現(xiàn)低成本、短周期、批量化的內(nèi)容生產(chǎn)模式,以及構(gòu)建大量產(chǎn)品外觀及IP形象的立體數(shù)據(jù)庫、加快演進AIGC在多場景下的商業(yè)化應(yīng)用。

直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

智象未來在“死磕”技術(shù)的同時,對于商業(yè)化也有著務(wù)實的發(fā)展路徑。從2023年3月成立以來,智象未來已經(jīng)確立了清晰的“多模態(tài)大模型+應(yīng)用”的布局。

隨著“AI+”向產(chǎn)業(yè)的不斷延伸, 在現(xiàn)有的業(yè)務(wù)中提前布局大模型應(yīng)用能力,從而提升產(chǎn)品效能,拓寬產(chǎn)品應(yīng)用邊界,已逐漸成為眾多領(lǐng)域頭部企業(yè)戰(zhàn)略發(fā)展的首要重心。

直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

在本次論壇發(fā)布會中,印象筆記、杭州靈伴兩家企業(yè)宣布與智象未來展開戰(zhàn)略合作,旨在將大模型技術(shù)應(yīng)用于云端服務(wù)。這些合作將使各方能夠發(fā)揮各自的行業(yè)優(yōu)勢,率先引入AIGC技術(shù),為用戶帶來更加智能化的內(nèi)容創(chuàng)作體驗。

在此之前智象未來已與中國移動、聯(lián)想集團、科大訊飛、上影集團、慈文集團、神州數(shù)碼、央視網(wǎng)、天工異彩等知名企業(yè)建立了戰(zhàn)略合作關(guān)系。其中,與中國移動咪咕共同開發(fā)的“AI一語成片”應(yīng)用,不僅為普通用戶提供了零門檻的AI視頻彩鈴創(chuàng)作工具,還幫助企業(yè)客戶制作豐富的品牌和營銷視頻內(nèi)容,讓每個企業(yè)都能擁有獨特的彩鈴品牌標識。

“智象大模型” 是智象未來自主研發(fā)的Diffusion Transformer (DiT) 架構(gòu)模型,是全球范圍內(nèi)首個上線開放使用的圖像和視頻生成平臺,能夠契合多行業(yè)場景中的能力需求,并已通過模型和算法雙備案。截至目前基于“智象大模型”構(gòu)建的“智象 AI ”系列產(chǎn)品,全球單月訪問量超百萬、累計AIGC內(nèi)容生成破千萬;已服務(wù)的頭部企業(yè)客戶近百家,中小企業(yè)超三萬家,API已被調(diào)用300萬余次。

直擊2024 WAIC | “智象大模型2.0” 領(lǐng)航多模態(tài)大模型行業(yè)應(yīng)用與發(fā)展

智象未來在2024 WAIC中所展現(xiàn)的卓越性能,不僅證明了其在技術(shù)研發(fā)和商業(yè)化方面的亮眼成績,更預(yù)示了未來多模態(tài)大模型行業(yè)應(yīng)用領(lǐng)域的巨大潛力和發(fā)展前景。

本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:https://m.sohu.com/a/791264593_100113173

陳晨陳晨管理團隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論