埃隆·馬斯克 (Elon Musk) 旗下的人工智能初創(chuàng)公司 X.ai 發(fā)布了其最新的生成式人工智能模型 Grok-1.5。 Grok-1.5 將在不久的將來(lái)為社交網(wǎng)絡(luò) X 的 Grok 聊天機(jī)器人提供支持(X.ai 在博客文章中寫(xiě)道,“在未來(lái)的日子里” ),Grok-1.5 似乎是對(duì)其前身 Grok-1 的重大升級(jí)——至少?gòu)?X 發(fā)布的基準(zhǔn)測(cè)試結(jié)果和規(guī)格來(lái)看。
根據(jù) X.ai 的說(shuō)法,Grok-1.5 受益于“改進(jìn)的推理”,特別是在涉及編碼和數(shù)學(xué)相關(guān)任務(wù)時(shí)。該模型在流行的數(shù)學(xué)基準(zhǔn) MATH 上的得分比 Grok-1 的得分高出一倍多,并且在編程語(yǔ)言生成和問(wèn)題解決能力的 HumanEval 測(cè)試中得分高出十多個(gè)百分點(diǎn)。
當(dāng)然,很難預(yù)測(cè)這些結(jié)果將如何轉(zhuǎn)化為實(shí)際使用。正如我們最近所寫(xiě)的,常用的人工智能基準(zhǔn)測(cè)試衡量研究生水平化學(xué)考試問(wèn)題的表現(xiàn)等深?yuàn)W的東西,但在捕捉當(dāng)今普通人如何與模型交互方面表現(xiàn)不佳。
與 Grok-1 相比,Grok-1.5 可以吸收的上下文量是一項(xiàng)應(yīng)該會(huì)帶來(lái)明顯收益的改進(jìn)。
Grok-1.5 有 128,000 個(gè)令牌上下文——“令牌”指的是原始文本位(例如,單詞“fantastic”分為“fan”、“tas”和“tic”)。上下文或上下文窗口是指模型在生成輸出(更多文本)之前考慮的輸入數(shù)據(jù)(在本例中為文本)。具有較小上下文窗口的模型往往會(huì)忘記甚至是最近的對(duì)話(huà)內(nèi)容,而具有較大上下文的模型則避免了這種陷阱 – 而且作為一個(gè)額外的好處,可以更好地掌握它們所接收的數(shù)據(jù)流。
“[Grok-1.5 可以]利用更長(zhǎng)文檔中的信息,”X.ai 在上述博客文章中寫(xiě)道。 “此外,該模型可以處理更長(zhǎng)、更復(fù)雜的提示,同時(shí)在上下文窗口擴(kuò)展時(shí)仍然保持其指令跟蹤能力?!?/p>
從歷史上看,X.ai 的 Grok 模型與其他生成式 AI 模型的不同之處在于,它們回答了其他模型通常無(wú)法觸及的主題問(wèn)題,例如陰謀和更具爭(zhēng)議性的政治思想。正如馬斯克所描述的那樣,這些模型還以“叛逆的態(tài)度”回答問(wèn)題,如果有人要求的話(huà),還會(huì)使用完全粗魯?shù)恼Z(yǔ)言。
目前還不清楚 Grok-1.5 在這些領(lǐng)域帶來(lái)了哪些變化。 X.ai 在博客文章中沒(méi)有提及這一點(diǎn)。
X.ai 表示,Grok-1.5 很快將提供給 X 上的早期測(cè)試人員,并附帶“幾項(xiàng)新功能”。馬斯克此前曾暗示要總結(jié)帖子和回復(fù),并建議帖子內(nèi)容;我們會(huì)看看這些是否能盡快到達(dá)。
Grok-1.5 是在 X.ai開(kāi)源Grok-1 之后發(fā)布的,盡管沒(méi)有微調(diào)或進(jìn)一步訓(xùn)練它所需的代碼。最近,馬斯克表示,X 上的更多用戶(hù)——特別是那些支付 X 每月 8 美元高級(jí)套餐費(fèi)用的用戶(hù)——將能夠使用聊天機(jī)器人 Grok,該機(jī)器人此前僅適用于 X Premium+ 客戶(hù),每月支付 16 美元。
原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/641817.html