小米AI大模型MiLM-6B曝光 64億參數(shù)同參數(shù)量級排名第1

科技巨頭們的AI大模型早已拉開了序幕,互聯(lián)網(wǎng)公司百度和阿里已經(jīng)發(fā)布了各自的大模型,而近日騰訊也曝光了自己的大模型。科技訊今日發(fā)現(xiàn),雖然小米公司沒有公開宣布自己加入大模型之戰(zhàn),但我們卻在Github上發(fā)現(xiàn)了小米大模型的蹤影。

在Github小米這樣介紹MiLM-6B:MiLM-6B是由小米開發(fā)的一個大規(guī)模預(yù)訓(xùn)練語言模型,參數(shù)規(guī)模為64億。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。除了Github小米的AI大模型MiLM-6B還進(jìn)入了C-Eval、CMMLU大模型評測榜單,截至當(dāng)前,小米大模型在C-Eval 總榜單排名第10、同參數(shù)量級排名第 1。

小米AI大模型MiLM-6B曝光 64億參數(shù)同參數(shù)量級排名第1

根據(jù) GitHub 項目頁給出的信息得知,MiLM-6B 是由小米公司開發(fā)的一個大規(guī)模預(yù)訓(xùn)練語言模型,參數(shù)規(guī)模達(dá) 64 億。

而根據(jù) C-Eval 給出的信息,MiLM-6B 模型在具體各科目成績上,在 STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué)教育)全部 20 個科目中,計量師、物理、化學(xué)、生物等多個項目獲得了較高的準(zhǔn)確率。

小米AI大模型MiLM-6B曝光 64億參數(shù)同參數(shù)量級排名第1

MiLM-6B 模型目前已經(jīng)在大多數(shù)文科科目中表現(xiàn)出了相對良好的準(zhǔn)確度,不過在“法學(xué)、數(shù)學(xué)、編程、概率論、離散數(shù)學(xué)”等涉及“抽象思維”的科目中,還有一定進(jìn)步空間。

在 10 個“社會科學(xué)”測試科目中,除“教育學(xué)和地理”外,該模型在其他 8 個科目中都獲得了較為理想的準(zhǔn)確率。在人文科學(xué)的 11 個科目中,MiLM-6B 則在“歷史與法律”基礎(chǔ)上有著不錯的準(zhǔn)確率表現(xiàn)。

AI 大模型 MiLM-6B 當(dāng)下才首次曝光,不過完成度已經(jīng)較高,在未來該模型可能會被用于小米旗下“小愛同學(xué)”等虛擬助理服務(wù)中。

原創(chuàng)文章,作者:小科同學(xué),如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/575604.html

小科同學(xué)的頭像小科同學(xué)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論