OpenAI公布大模型新訓(xùn)練方法：阻止ChatGPT“胡說八道”

蘋果派 ? 2023年6月1日 01:39:45 ? 新聞

OpenAI公司通過論文介紹了一種全新的方法，來訓(xùn)練生成式人工智能語言模型

6月1日，據(jù)報道，當(dāng)?shù)貢r間周三，OpenAI公司通過論文介紹了一種全新的方法，來訓(xùn)練生成式人工智能語言模型。

OpenAI這一研究成果來得很是時候，最近，隨著生成式人工智能技術(shù)流行，以及美國2024年總統(tǒng)大選初步啟動，人工智能“胡說八道”的問題引發(fā)了史無前例的關(guān)注和討論。

去年，OpenAI公司推出了人工智能對話撰稿工具ChatGPT，背后依托于GPT3和GPT4語言模型。ChatGPT的優(yōu)秀表現(xiàn)在全世界掀起了生成式人工智能的一股風(fēng)暴，兩個月之內(nèi)，相關(guān)服務(wù)的月度活躍用戶超過了一億人，用戶增長速度創(chuàng)造了新的世界紀(jì)錄。

OpenAI背后的大股東之一是微軟，微軟已經(jīng)累計對該公司投資130億美元。目前，OpenAI的市值大約為290億美元。

人工智能“胡說八道”，術(shù)語上也被稱為“AI幻覺”。面對用戶的提問，ChatGPT以及谷歌的Bard等工具會杜撰出一些虛假信息，看上去像是權(quán)威正確的答案。

比如，今年2月谷歌針對Bard工具推出了一個演示視頻，視頻中Bard有關(guān)美國韋伯太空望遠(yuǎn)鏡的描述就存在錯誤。此外，美國紐約的幾位律師最近使用ChatGPT撰寫法律文件，ChatGPT描述了完全虛構(gòu)的案例，這些律師將面臨處罰。

OpenAI公司的研究人員表示，即使是最先進(jìn)的人工智能模型也會杜撰虛假信息，尤其是在拿不準(zhǔn)的時候，它們往往傾向于編造事實(shí)。

研究人員表示，在要求多步驟推理的領(lǐng)域，人工智能胡編的后果尤為嚴(yán)重，因?yàn)橐粋€單一的邏輯錯誤會導(dǎo)致整個解決方案“翻車”。

OpenAI準(zhǔn)備采用新戰(zhàn)略，防止人工智能胡編。比如在過去，一旦提供一個正確的最終答案，模型會獲得某種鼓勵，但是以后，在每一個單一的邏輯推理環(huán)節(jié)如果表現(xiàn)正確，就將獲得鼓勵反饋。這種模式也被稱之為“過程監(jiān)督”（以往的模式術(shù)語“結(jié)果監(jiān)督”）。

研究人員表示，“過程監(jiān)督”模式有助于產(chǎn)生更加清晰合理的回答，它將會鼓勵生成式人工智能能夠像人類一樣，在推理思考中做到“環(huán)環(huán)相扣”。

OpenAI公司“隨機(jī)生成數(shù)學(xué)”研究專家卡爾·柯比（Karl Cobbe）表示，發(fā)現(xiàn)并且減少人工智能模型的邏輯錯誤，也就是“AI幻覺”，是構(gòu)建“通用人工智能”的關(guān)鍵一步。另外，“過程監(jiān)督”模式并非OpenAI公司發(fā)明，但是該公司正在加以推廣普及。

柯比表示，新方法的目的，是解決人工智能胡編問題，從而讓語言模型能夠解決更加復(fù)雜的推理難題。

這位專家介紹，OpenAI已經(jīng)發(fā)布了一個研究使用的數(shù)據(jù)集，包括80萬條人工標(biāo)簽，可用上述新模式訓(xùn)練語言模型。

不過，美國電子隱私信息中心的資深律師本·魏特斯（Ben Winters）對這種新的訓(xùn)練模式表示質(zhì)疑，他希望親自查看OpenAI的完整數(shù)據(jù)集，以及相關(guān)的例子。

魏特斯表示，目前生成式人工智能還處于野蠻生長時代，OpenAI的新模式還無法實(shí)質(zhì)性緩解AI胡編亂造錯誤答案的問題。

這位律師表示，最重要的是，OpenAI是否會將一些研究論文成果部署到實(shí)際產(chǎn)品中，如果沒有這樣的計劃，這將會引發(fā)社會質(zhì)疑，即他們到底要向公眾發(fā)布怎樣的最終產(chǎn)品。

美國布朗大學(xué)的學(xué)者維克塔（Suresh Venkatasubramanian）表示，目前還不清楚OpenAI的研究論文是否經(jīng)過了同行評議，他認(rèn)為這一研究還僅僅停留在“初步觀察”階段。

維克塔表示，在做出某種確定性結(jié)論之前，研究論文還需要在學(xué)術(shù)圈子內(nèi)進(jìn)行更多傳播。他認(rèn)為，如今，人工智能領(lǐng)域每天都會有很多研究成果，但是“大型語言模型”在工作時存在不穩(wěn)定性，因此在某種條件、背景或者模式下的運(yùn)行結(jié)果，可能無法應(yīng)用于另外一種條件、背景或模式。

維克塔認(rèn)為，在人工智能胡編的問題中，包括了語言模型胡編一些他人引言或者參考信息。OpenAI的新論文并沒有證據(jù)能解決這一問題。

OpenAI專家柯比表示，未來將會在學(xué)術(shù)會議上把論文交給其他人，進(jìn)行同行評議。對于何時將會把研究成果和“過程監(jiān)督”整合到ChatGPT等最終產(chǎn)品中，OpenAI尚未發(fā)表官方評論。

美國人工智能研究專家薩拉·邁爾斯·韋斯特（Sarah Myers West）表示，人工智能公司開始解決虛假答案問題，這是一個好消息，但OpenAI目前的論文還停留在“公司內(nèi)部研究”的階段，還需要攻克更多難關(guān)。

韋斯特表示,在論文中，OpenAI發(fā)布一個“人類級反饋”的小規(guī)模數(shù)據(jù)集，但是并沒有訓(xùn)練GPT4模型所用數(shù)據(jù)的更多介紹。雖然生成式人工智能已經(jīng)開始改變普通人的工作生活，但是距離“負(fù)責(zé)任的人工智能應(yīng)用”，還存在相當(dāng)多的技術(shù)挑戰(zhàn)。

原創(chuàng)文章，作者：蘋果派，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/572147.html

蘋果派管理團(tuán)隊

0 0

AI

OpenAI GPT-5研發(fā)受阻，成本高昂效果未及預(yù)期

近日，《華爾街日報》報道稱，OpenAI正在研發(fā)的下一代大型語言模型GPT-5遭遇研發(fā)難題，進(jìn)度滯后且成果未達(dá)預(yù)期。這一消息與此前有關(guān)GPT-5可能無法實(shí)現(xiàn)顯著性能飛躍的報道相呼應(yīng)…

AI
5小時前
AI

意大利對OpenAI罰款1500萬歐元，因ChatGPT數(shù)據(jù)隱私違規(guī)

近日，意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)Garante發(fā)布公告，宣布對OpenAI處以1500萬歐元（約合1.14億元人民幣）的罰款。這一處罰是在對生成式AI應(yīng)用使用個人數(shù)據(jù)情況進(jìn)行調(diào)查后做出的?！?/p>

NEWS
1天前
AI

OpenAI更新macOS版ChatGPT，新增備忘錄及IDE支持

OpenAI近日對其macOS版ChatGPT應(yīng)用進(jìn)行了更新，新增了支持讀取macOS系統(tǒng)集成的備忘錄App（Apple Notes）及第三方備忘錄App如Notion等功能?，F(xiàn)在…

AI
1天前
AI

桌面版ChatGPT功能大升級：新增30余應(yīng)用支持

在OpenAI的“12天活動”進(jìn)入尾聲，在活動倒數(shù)第二天，公司展示了桌面版ChatGPT的功能改進(jìn)。此次演示強(qiáng)調(diào)，ChatGPT正逐步從聊天機(jī)器人向AI智能體工具轉(zhuǎn)變，旨在桌面環(huán)境…

AI
2天前
AI

北美監(jiān)管機(jī)構(gòu)警告：AI應(yīng)用激增或致明年大面積停電

隨著蘋果iOS 18.2系統(tǒng)的公開發(fā)布，Apple Intelligence的多項(xiàng)新功能正式亮相。然而，北美電力可靠性公司（NERC）近日卻發(fā)出了一項(xiàng)令人擔(dān)憂的警告。據(jù)《金融時報》…

AI
3天前
新聞

Cloudflare：2024 年全球互聯(lián)網(wǎng)流量同比增長 17.2%，美國仍是主要 Bot 流量來源地

Cloudflare報告2024年全球互聯(lián)網(wǎng)流量增17.2%，谷歌領(lǐng)跑，美國Bot流量最大。IPv6流量下降，移動設(shè)備流量占41.3%，Chrome瀏覽器領(lǐng)先。西班牙網(wǎng)速最快。

潮玩君
4天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項(xiàng)開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
4天前
商業(yè)

英偉達(dá)股價持續(xù)下滑，投資者擔(dān)憂AI支出前景

近日，英偉達(dá)股價持續(xù)呈現(xiàn)下跌趨勢，周二再跌1.2%，引發(fā)了市場的廣泛關(guān)注。這家全球領(lǐng)先的人工智能芯片制造商的股價，已從11月初的歷史高峰148.88美元下跌了約12%。據(jù)了解，投…

商業(yè)頭條
4天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個新模型在理解現(xiàn)實(shí)世界物理、人類運(yùn)動和表達(dá)的細(xì)微差別方面表現(xiàn)更出色，從而能夠進(jìn)一步提升視頻整體的細(xì)節(jié)和逼真度?！?/p>

Google
5天前
AI

OpenAI向所有用戶開放ChatGPT搜索功能

在“OpenAI 12天”活動進(jìn)展到第8天的時候，OpenAI發(fā)布了一則重要消息，現(xiàn)在所有登錄用戶都能夠使用ChatGPT搜索功能了。 OpenAI此次免費(fèi)向所有用戶開放ChatG…

AI
5天前
AI

ChatGPT搜索引擎向所有用戶免費(fèi)開放：新增實(shí)時搜索和高級語音功能

OpenAI推出搜索引擎工具，ChatGPT搜索功能獲大量更新，由GPT-4o模型支持，可快速獲取實(shí)時內(nèi)容，支持高級語音模式，移動端使用效率提升40%以上。

潮玩君
5天前
AI

月之暗面發(fā)布k1視覺思考模型，支持多領(lǐng)域圖像理解

今日，人工智能公司月之暗面宣布發(fā)布其最新的k1視覺思考模型。該模型基于強(qiáng)化學(xué)習(xí)技術(shù)，不僅在數(shù)學(xué)領(lǐng)域表現(xiàn)突出，還擴(kuò)展到了物理、化學(xué)等基礎(chǔ)科學(xué)領(lǐng)域，展現(xiàn)出強(qiáng)大的圖像理解和思維鏈能力。 …

AI
6天前
新聞

Meta要求加州阻止OpenAI轉(zhuǎn)營利計劃

據(jù)《華爾街日報》今日報道稱，Meta已致信加州總檢察長Rob Bonta，要求阻止OpenAI轉(zhuǎn)型為營利性企業(yè)的計劃。此舉表明，Meta在硅谷兩大AI巨頭間的爭斗中站在了馬斯克一方…

NEWS
2024年12月14日
AI

谷歌發(fā)布Gemini 2.0模型及Deep Research新功能

谷歌官方近日宣布，正式推出其最新一代人工智能模型——Gemini 2.0。據(jù)了解，自當(dāng)?shù)貢r間12月11日起，谷歌已將Gemini 2.0開放給開發(fā)者及受信任的測試人員，并正積極推進(jìn)…

Google
2024年12月13日
AI

OpenAI ChatGPT全球宕機(jī)，部分服務(wù)逐步恢復(fù)中

今日，全球知名的人工智能公司OpenAI遭遇了一次重大服務(wù)中斷，其備受歡迎的聊天機(jī)器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機(jī)現(xiàn)象。此外，與ChatGPT相關(guān)的Sora服務(wù)及API接口…

AI
2024年12月12日
新聞

ChatGPT 高級語音模式研究員創(chuàng)立WaveForms AI 新公司估值達(dá) 2 億美元

近日，有媒體報道，曾主導(dǎo)開發(fā)ChatGPT高級語音模式的前OpenAI研究員Alexis Conneau宣布創(chuàng)立WaveForms AI。這家新公司已完成由Andreessen H…

潮玩君
2024年12月11日
新聞

Counterpoint：2024年Q3全球半導(dǎo)體市場回暖，AI和內(nèi)存需求強(qiáng)勁

近日，市場調(diào)查機(jī)構(gòu)Counterpoint Research發(fā)布報告稱，2024年第三季度全球半導(dǎo)體市場呈現(xiàn)回暖趨勢，主要得益于人工智能（AI）技術(shù)需求和內(nèi)存市場的復(fù)蘇。報告顯示…

李小白
2024年12月11日
AI

OpenAI推出Sora文生視頻AI模型，支持1080P高清視頻生成

昨日，OpenAI公司宣布正式推出其最新的Sora文生視頻AI模型。此次發(fā)布的新版本為Sora Turbo，相較于今年2月推出的預(yù)覽版，生成速度有了顯著提升。據(jù)了解，Sora T…

AI
2024年12月10日
AI

Sora二代實(shí)機(jī)演示曝光，支持圖生視頻功能

近日，關(guān)于Sora二代的實(shí)機(jī)演示視頻被曝光，展示了其強(qiáng)大的圖生視頻功能。據(jù)泄露視頻顯示，Sora v2不僅支持長達(dá)1分鐘的視頻輸出，還提供了三種生成模式，包括文本轉(zhuǎn)視頻、文本+圖像…

AI
2024年12月9日
AI

OpenAI新功能太強(qiáng)大，每月服務(wù)費(fèi)200美元

近日，OpenAI在其“12天12場直播”活動的首秀中，發(fā)布了推理大模型o1的滿血版本及進(jìn)階模式，并推出了ChatGPT Pro訂閱服務(wù)。這一服務(wù)每月收費(fèi)200美元，為用戶提供了前…

AI
2024年12月7日

OpenAI公布大模型新訓(xùn)練方法：阻止ChatGPT“胡說八道”

相關(guān)推薦