OpenAI GPT-4o模型道德推理能力超越人類專家

AI ? 2024年6月24日 12:08:00 ? AI

近期，一項(xiàng)由美國北卡羅萊納大學(xué)教堂山分校和艾倫 AI 研究所共同進(jìn)行的研究顯示，OpenAI 的最新聊天機(jī)器人 GPT-4o 在道德解釋和建議方面展現(xiàn)出超越人類專家的能力。這一發(fā)現(xiàn)引發(fā)了關(guān)于人工智能（AI）在道德推理領(lǐng)域應(yīng)用的廣泛討論。

在這項(xiàng)研究中，研究人員進(jìn)行了兩項(xiàng)對比實(shí)驗(yàn)，旨在探討 GPT 模型與人類道德推理能力的差異。在第一項(xiàng)研究中，501 名美國成年人被要求對比 GPT-3.5-turbo 模型的道德解釋與其他人類參與者的解釋。結(jié)果顯示，GPT 的解釋被認(rèn)為更符合道德、更值得信賴、更周到，且評估者認(rèn)為 AI 的評估比其他人更可靠。盡管差異較小，但這一發(fā)現(xiàn)表明 AI 在道德推理方面能夠匹配甚至超越人類水平。

在第二項(xiàng)研究中，研究人員將 GPT-4o 模型生成的建議與《紐約時報》“倫理學(xué)家”專欄中著名倫理學(xué)家 Kwame Anthony Appiah 的建議進(jìn)行了比較。在針對 50 個“倫理困境”的建議質(zhì)量評分中，GPT-4o 在“幾乎每個方面”都獲得了比人類專家更高的評分。參與者普遍認(rèn)為 AI 生成的建議在道德上更正確、更值得信賴、更周到、更準(zhǔn)確。只有在感知細(xì)微差別方面，人工智能和人類專家之間沒有顯著差異。

研究人員認(rèn)為，這些結(jié)果表明 GPT-4o 已經(jīng)通過了所謂的“比較道德圖靈測試”（cMTT）。進(jìn)一步分析顯示，GPT-4o 在提供建議時使用的道德和積極語言比人類專家更多，這可能是導(dǎo)致其建議評分更高的原因之一。然而，研究人員也指出，這并非唯一因素，未來還需要進(jìn)行更多研究以深入探索 AI 在道德推理領(lǐng)域的潛力。

值得注意的是，這項(xiàng)研究僅針對美國參與者進(jìn)行，因此后續(xù)研究還需要探討不同文化背景下人們對 AI 生成的道德推理的看法。盡管如此，這一發(fā)現(xiàn)仍然為 AI 在道德決策支持領(lǐng)域的應(yīng)用提供了有力支持，并可能引發(fā)關(guān)于 AI 道德責(zé)任和監(jiān)管的進(jìn)一步討論。

隨著 AI 技術(shù)的不斷進(jìn)步，其在道德推理領(lǐng)域的應(yīng)用將越來越廣泛。從醫(yī)療診斷到自動駕駛汽車，再到社交媒體內(nèi)容審核，AI 的道德決策能力將直接影響到人類社會的各個方面。因此，我們需要更加關(guān)注 AI 的道德問題，并制定相應(yīng)的政策和規(guī)范以確保 AI 的安全和可靠。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/662942.html

AI GPT 模型 GPT-4o OpenAI 人工智能

AI認(rèn)證作者

0 0

AI

?谷歌Gemini AI將推Ultra訂閱版！視頻生成限制或解除

近日，據(jù)外媒報道稱，谷歌計劃擴(kuò)展其人工智能服務(wù)Gemini AI的訂閱體系，或新增“Gemini Ultra”高級層級。此舉或進(jìn)一步強(qiáng)化其在生成式AI領(lǐng)域的商業(yè)化布局。目前，谷歌…

Google
3天前
新聞

馬斯克官宣Grok 3.5下周上線首個能解答火箭難題的AI要來了

當(dāng)?shù)貢r間4月29日，特斯拉及SpaceX創(chuàng)始人埃隆·馬斯克通過社交平臺宣布，旗下人工智能產(chǎn)品Grok 3.5的早期測試版將于下周正式向“SuperGrok”訂閱用戶開放。他稱，Gr…

AI
5天前
AI

?ChatGPT搜索上線網(wǎng)購功能：智能推薦+無廣告模式重新定義購物體驗(yàn)

今日，OpenAI在X平臺宣布，ChatGPT搜索功能正式上線網(wǎng)購服務(wù)，覆蓋時尚、美妝、家居用品及電子產(chǎn)品等類目。用戶可通過自然提問獲取商品推薦，系統(tǒng)將同步展示產(chǎn)品詳情、用戶評價及…

AI
5天前
新聞

ChatGPT殺入電商賽道：一鍵直達(dá)商家頁面，免登錄也能買買買

OpenAI于4月29日宣布，即日起ChatGPT殺入電商賽道，所有用戶均可通過ChatGPT直接購買商品，無需注冊或登錄賬戶。用戶點(diǎn)擊對話界面新增的“購物按鈕”后，系統(tǒng)將基于歷史…

檸萌
6天前
新聞

昆侖萬維豪賭AI致巨虧16億，投資者買單？

4月25日，昆侖萬維（300418.SZ）交出一份令市場嘩然的成績單：2024年?營業(yè)總收入56.6億元，同比增長15.2%?，但歸母凈利潤卻巨虧?15.95億元?，同比暴跌226…

聆聽
6天前
新聞

英偉達(dá)GTC大會首度登陸臺北國際電腦展，AI技術(shù)盛宴即將開幕

英偉達(dá)官網(wǎng)最新信息顯示，其年度技術(shù)盛會?GTC Taipei 2025?將于5月21日至22日在臺北漢來大飯店舉行，同期配套的實(shí)作坊活動則從5月20日持續(xù)至22日。這是英偉達(dá)首次將…

野游栗
2025年4月28日
AI

OpenAI開放免費(fèi)體驗(yàn)！Deep Research輕量版AI搜索功能上線

人工智能公司OpenAI近日宣布，面向全體用戶推出輕量版Deep Research AI搜索功能。新功能基于o4-mini模型開發(fā)，免費(fèi)用戶每月可獲得5次使用機(jī)會，付費(fèi)用戶將根據(jù)訂…

AI
2025年4月27日
新聞

AI智能體公司完成7500萬美元融資，估值四個月暴漲四倍

彭博社報道稱，中國通用型AI智能體開發(fā)商蝴蝶效應(yīng)（Butterfly Effect）近期完成7500萬美元（約合5.47億元人民幣）融資，由美國頂級風(fēng)投Benchmark領(lǐng)投，現(xiàn)有…

商業(yè)頭條
2025年4月25日
新聞

?蘋果管理層再調(diào)整：AI負(fù)責(zé)人卸任機(jī)器人項(xiàng)目，兩大硬件團(tuán)隊(duì)合并

據(jù)彭博社報道，蘋果公司宣布新一輪管理層架構(gòu)調(diào)整，人工智能與機(jī)器學(xué)習(xí)高級副總裁約翰·賈南德雷亞（John Giannandrea）不再負(fù)責(zé)秘密機(jī)器人項(xiàng)目，其管理職責(zé)將轉(zhuǎn)交硬件工程高級…

Apple
2025年4月25日
新聞

?傳媒巨頭Ziff Davis起訴OpenAI：指控非法抓取數(shù)百萬文章訓(xùn)練AI

據(jù)外媒報道稱，美國數(shù)字媒體集團(tuán)Ziff Davis正式向紐約聯(lián)邦法院提起訴訟，指控人工智能公司OpenAI在未經(jīng)授權(quán)的情況下，“系統(tǒng)性復(fù)制”其旗下包括CNET、PCMag等45個媒…

小丸子
2025年4月25日
AI

OpenAI全面開放Deep Research：免費(fèi)用戶首獲輕量版

今日，OpenAI宣布對其核心產(chǎn)品Deep Research進(jìn)行重大升級。即日起，所有免費(fèi)用戶均可使用輕量版服務(wù)，Plus、Team和Pro用戶則獲得更高頻次調(diào)用權(quán)限，而企業(yè)與教育…

AI
2025年4月25日
新聞

英偉達(dá)高管:AI數(shù)據(jù)中心建設(shè)熱度未減

當(dāng)?shù)貢r間4月24日，在美國哈姆能源研究院主辦的行業(yè)峰會上，英偉達(dá)、亞馬遜及AI初創(chuàng)公司高管集體發(fā)聲，強(qiáng)調(diào)全球人工智能數(shù)據(jù)中心建設(shè)仍保持高速推進(jìn)。英偉達(dá)高管:AI數(shù)據(jù)中心建設(shè)熱度未減…

李森
2025年4月25日
出海

沃爾瑪發(fā)布AI工具，顛覆服裝業(yè)

沃爾瑪正式宣布其自主研發(fā)的生成式AI工具“Trend-to-Product”全面應(yīng)用于服裝開發(fā)，該工具通過分析社交媒體、電商平臺等渠道的實(shí)時數(shù)據(jù)，將傳統(tǒng)服裝開發(fā)周期從18周縮短至6…

AI
2025年4月25日
新聞

?微軟Microsoft 365 Copilot免費(fèi)用戶5月將迎重大更新：導(dǎo)航界面全面改版

據(jù)外媒披露，微軟計劃自5月中旬起向所有Microsoft 365 Copilot Chat用戶（無需付費(fèi)訂閱許可證）推送“Wave 2春季更新”。此次升級重點(diǎn)優(yōu)化導(dǎo)航與交互邏輯，旨…

Microsoft
2025年4月24日
AI

?Gemini用戶半年激增3倍谷歌AI月活破3.5億緊追ChatGPT

根據(jù)谷歌反壟斷訴訟中最新披露的內(nèi)部數(shù)據(jù)，其人工智能聊天機(jī)器人Gemini全球月活躍用戶數(shù)（MAU）在今年3月達(dá)到3.5億，較六個月前增長近3倍。這是谷歌首次公開該產(chǎn)品的用戶增長軌跡…

Google
2025年4月24日
AI

OpenAI計劃開源首款A(yù)I模型推理性能對標(biāo)Meta、谷歌

近日，OpenAI正式確認(rèn)將推出自2019年GPT-2以來的首個開源語言模型。據(jù)知情人士透露，該模型由研究副總裁Aidan Clark主導(dǎo)開發(fā)，計劃于今年夏季初發(fā)布，其核心目標(biāo)是在…

AI
2025年4月24日
AI

英偉達(dá)發(fā)布Eagle 2.5視覺語言模型：8B參數(shù)單挑GPT-4o

英偉達(dá)于近日發(fā)布全新視覺語言模型Eagle 2.5，這款僅8B參數(shù)的AI在長視頻理解領(lǐng)域?qū)崿F(xiàn)突破。該模型在Video-MME基準(zhǔn)測試（512幀輸入）中斬獲72.4%準(zhǔn)確率，性能直指…

AI
2025年4月23日
產(chǎn)品

OpenAI或?qū)⑹召徆雀鐲hrome 反壟斷案庭審曝重磅合作內(nèi)幕?

4月23日，美國司法部針對谷歌的反壟斷案庭審曝出驚人消息：OpenAI高管出庭作證稱，該公司曾試圖與谷歌達(dá)成搜索技術(shù)合作但遭拒絕，而司法部正推動強(qiáng)制拆分谷歌Chrome瀏覽器及數(shù)字…

科技探索者
2025年4月23日
AI

OpenAI o3及o4-mini模型被曝植入“隱形水印”：AI生成文本暗藏特殊符號

AI初創(chuàng)公司Rumi近日發(fā)布報告稱，OpenAI最新發(fā)布的o3及o4-mini模型中，其生成的文本內(nèi)嵌入了特殊Unicode字符“窄不換行空格”（NNBSP，U+202F），疑似用…

AI
2025年4月22日
新聞

消息稱馬斯克或考慮為xAI進(jìn)行新一輪融資

據(jù)知情人士向媒體透露，埃隆·馬斯克近期在與xAI投資者的電話會議中表示，正考慮為旗下人工智能公司xAI“賦予適當(dāng)價值”。這一表態(tài)被外界解讀為該企業(yè)或正在籌備新一輪大規(guī)模融資，而數(shù)月…

NEWS
2025年4月22日

發(fā)表回復(fù)

登錄后才能評論

OpenAI GPT-4o模型道德推理能力超越人類專家

相關(guān)推薦

發(fā)表回復(fù)

分享到: