科技巨頭們的AI大模型早已拉開(kāi)了序幕,互聯(lián)網(wǎng)公司百度和阿里已經(jīng)發(fā)布了各自的大模型,而近日騰訊也曝光了自己的大模型。科技訊今日發(fā)現(xiàn),雖然小米公司沒(méi)有公開(kāi)宣布自己加入大模型之戰(zhàn),但我們卻在Github上發(fā)現(xiàn)了小米大模型的蹤影。
在Github小米這樣介紹MiLM-6B:MiLM-6B是由小米開(kāi)發(fā)的一個(gè)大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,參數(shù)規(guī)模為64億。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。除了Github小米的AI大模型MiLM-6B還進(jìn)入了C-Eval、CMMLU大模型評(píng)測(cè)榜單,截至當(dāng)前,小米大模型在C-Eval 總榜單排名第10、同參數(shù)量級(jí)排名第 1。
根據(jù) GitHub 項(xiàng)目頁(yè)給出的信息得知,MiLM-6B 是由小米公司開(kāi)發(fā)的一個(gè)大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,參數(shù)規(guī)模達(dá) 64 億。
而根據(jù) C-Eval 給出的信息,MiLM-6B 模型在具體各科目成績(jī)上,在 STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué)教育)全部 20 個(gè)科目中,計(jì)量師、物理、化學(xué)、生物等多個(gè)項(xiàng)目獲得了較高的準(zhǔn)確率。
MiLM-6B 模型目前已經(jīng)在大多數(shù)文科科目中表現(xiàn)出了相對(duì)良好的準(zhǔn)確度,不過(guò)在“法學(xué)、數(shù)學(xué)、編程、概率論、離散數(shù)學(xué)”等涉及“抽象思維”的科目中,還有一定進(jìn)步空間。
在 10 個(gè)“社會(huì)科學(xué)”測(cè)試科目中,除“教育學(xué)和地理”外,該模型在其他 8 個(gè)科目中都獲得了較為理想的準(zhǔn)確率。在人文科學(xué)的 11 個(gè)科目中,MiLM-6B 則在“歷史與法律”基礎(chǔ)上有著不錯(cuò)的準(zhǔn)確率表現(xiàn)。
AI 大模型 MiLM-6B 當(dāng)下才首次曝光,不過(guò)完成度已經(jīng)較高,在未來(lái)該模型可能會(huì)被用于小米旗下“小愛(ài)同學(xué)”等虛擬助理服務(wù)中。
原創(chuàng)文章,作者:小科同學(xué),如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/575604.html