SimpleQA

新聞

OpenAI推出SimpleQA基準(zhǔn)，專治AI模型“胡言亂語(yǔ)”

近日，OpenAI宣布推出一個(gè)新的基準(zhǔn)測(cè)試工具SimpleQA，旨在衡量語(yǔ)言模型在回答簡(jiǎn)短事實(shí)尋求問(wèn)題時(shí)的準(zhǔn)確性。這一舉措針對(duì)的是AI領(lǐng)域中的一個(gè)長(zhǎng)期難題：如何訓(xùn)練模型生成事實(shí)正確…

AI
2024年10月31日