8大維度600道題盲測(cè),訊飛星火成中國(guó)“最聰明”大模型

去年11月ChatGPT發(fā)布后,全世界掀起了AIGC熱潮,國(guó)內(nèi)各大企業(yè)和投資人也紛紛跟進(jìn)。

百模大戰(zhàn)一觸即發(fā)

各家大模型紛紛入局,一時(shí)之間國(guó)內(nèi)大模型領(lǐng)域呈現(xiàn)出少有的熱鬧景象。

到目前為止,國(guó)內(nèi)已經(jīng)發(fā)布的10億參數(shù)以上大模型數(shù)量超過(guò)80個(gè),“百模大戰(zhàn)”的競(jìng)爭(zhēng)格局初步形成。

8大維度600道題盲測(cè),訊飛星火成中國(guó)“最聰明”大模型

競(jìng)爭(zhēng)格局出現(xiàn)變化

近日,麻省理工科技評(píng)論對(duì)國(guó)內(nèi)排名靠前的四個(gè)大模型進(jìn)行了一次全方位評(píng)測(cè),參評(píng)的大模型分別是訊飛星火、百度文心一言、商湯商量、阿里通義千問(wèn)。在最終的評(píng)測(cè)結(jié)果中,訊飛星火以整體水平得分率81.50%高居第一,成為“最聰明”國(guó)產(chǎn)大模型。

8大維度600道題盲測(cè),訊飛星火成中國(guó)“最聰明”大模型

此次評(píng)測(cè)是從權(quán)威題庫(kù)中抽取8個(gè)維度的600道題對(duì)參評(píng)大模型進(jìn)行盲測(cè)。

從各維度的結(jié)果來(lái)看,在8個(gè)一級(jí)分類中,訊飛星火共獲得其中6個(gè)一級(jí)分類的第一名。

麻省理工科技評(píng)論的評(píng)測(cè)報(bào)告還重點(diǎn)指出:在編程能力評(píng)測(cè)中,訊飛星火 80% 的得分率明顯高于 71%的平均值,在生成代碼的簡(jiǎn)答題單項(xiàng)上,訊飛星火的得分率高達(dá) 82%,遠(yuǎn)高于其他平臺(tái),表現(xiàn)頗為亮眼。

8大維度600道題盲測(cè),訊飛星火成中國(guó)“最聰明”大模型

無(wú)獨(dú)有偶,就在此前幾天的8月12日,新華社研究院中國(guó)企業(yè)發(fā)展研究中心發(fā)布《人工智能大模型體驗(yàn)報(bào)告2.0》,在該《報(bào)告》中,訊飛星火V1.5就以總分1013分位列本次國(guó)產(chǎn)主流大模型測(cè)評(píng)榜首位。在四大評(píng)測(cè)維度中的智商指數(shù)和工具提效指數(shù)兩個(gè)維度獲得第一,《報(bào)告》認(rèn)為訊飛星火“在工作提效方面優(yōu)勢(shì)明顯”。

行業(yè)應(yīng)用加速落地

8月15日,科大訊飛發(fā)布了星火認(rèn)知大模型V2.0,V2.0在代碼能力和多模態(tài)能力方面的表現(xiàn)讓人印象頗為深刻。而在應(yīng)用落地方面,訊飛也展示出快人一步的節(jié)奏,無(wú)論是對(duì)標(biāo)Copilot X的智能編程助手iFlyCode1.0,還是行業(yè)首創(chuàng)的星火教師助手,都展現(xiàn)出了很強(qiáng)的競(jìng)爭(zhēng)力。

按理說(shuō),訊飛星火能取得這樣的成績(jī)并不令人意外。畢竟,科大訊飛自成立以來(lái),一直都聚焦在AI領(lǐng)域潛心發(fā)展,無(wú)論是人才還是技術(shù),都有著不錯(cuò)的積累。

隨著訊飛星火開(kāi)始在大模型領(lǐng)域嶄露鋒芒,國(guó)內(nèi)大模型市場(chǎng)的競(jìng)爭(zhēng)格局或許也會(huì)隨之迎來(lái)不小的變化。

細(xì)分定位勢(shì)在必行

在模型能力層面,訊飛星火和文心一言開(kāi)始形成國(guó)內(nèi)大模型領(lǐng)域的第一梯隊(duì)。而在應(yīng)用落地的速度方面,現(xiàn)已發(fā)布了多款行業(yè)應(yīng)用的科大訊飛似乎已經(jīng)走在了前面。

鑒于國(guó)內(nèi)大模型企業(yè)相對(duì)同質(zhì)化的定位,后續(xù)的競(jìng)爭(zhēng)應(yīng)該會(huì)日趨激烈。如何在繼續(xù)加強(qiáng)大模型通用能力的同時(shí),找到自己在垂直細(xì)分領(lǐng)域的精準(zhǔn)定位,或許已經(jīng)成為很多大模型企業(yè)不得不認(rèn)真思考的問(wèn)題。

?

原創(chuàng)文章,作者:陳晨,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/576517.html

陳晨陳晨管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論