GPT-4眼科評估能力驚艷，但專家警告需審慎應用

若安丶 ? 2024年4月21日 06:35:00 ? AI

劍橋大學臨床醫(yī)學院的最新研究發(fā)現(xiàn)，OpenAI的GPT-4模型在眼科評估中的表現(xiàn)幾乎可與該領域的專家相媲美。這一突破性成果在金融時報首次報道后，引起了醫(yī)療和科技界的廣泛關注。

在這項發(fā)表在PLOS數(shù)字健康雜志上的研究中，研究人員對GPT-4及其前身GPT-3.5、谷歌的PaLM 2以及梅塔美洲駝進行了眼科知識測試。測試內容涵蓋了從光敏感到病變等各個方面的87道選擇題，難度與眼科教科書中的題目相當。五名眼科專家、三名實習眼科醫(yī)生和兩名非專業(yè)初級醫(yī)生也接受了相同的模擬考試。值得注意的是，這些題目對于LLM模型而言是全新的，因為它們之前并未接觸過相關內容。

在測試中，GPT-4展現(xiàn)了令人印象深刻的表現(xiàn)，答對了60道問題，得分高于實習醫(yī)生和初級醫(yī)生。盡管這一成績略遜于眼科專家的平均得分66.4，但已足以顯示其在眼科評估領域的巨大潛力。相比之下，PaLM 2、GPT-3.5和梅塔美洲駝的得分分別為49分、42分和28分，均低于初級醫(yī)生的平均水平。

然而，盡管這些結果展示了LLM在醫(yī)療領域的潛在應用，研究人員也警告稱，必須謹慎對待這些模型的輸出結果。他們指出，測試中的問題數(shù)量有限，特別是在某些類別中，這可能導致實際結果有所偏差。此外，LLM模型存在“幻覺”現(xiàn)象，即生成不相關或錯誤的事實，這在醫(yī)療領域尤為危險。如果模型錯誤地診斷出白內障或癌癥等嚴重疾病，將可能對患者造成嚴重后果。

研究人員強調，雖然LLM模型在眼科評估中展現(xiàn)了令人鼓舞的初步成果，但在實際應用中仍需謹慎對待。未來，應進一步探索如何提高模型的準確性和可靠性，以確保其能夠安全、有效地服務于醫(yī)療領域。

此項研究為LLM模型在醫(yī)療領域的應用提供了新的視角，也提醒我們在追求技術進步的同時，必須關注其潛在的風險和局限性。隨著LLM技術的不斷發(fā)展，我們期待未來能夠看到更多關于其如何在醫(yī)療領域造福社會的報道。

原創(chuàng)文章，作者：若安丶，如若轉載，請注明出處：http://2079x.cn/article/648782.html

GPT-4 OpenAI 眼科評估谷歌

若安丶管理團隊

0 0

新聞

?谷歌Chrome 136全球推送：封堵20年歷史隱私漏洞，用戶速更新

谷歌于近日宣布，正式向Windows、Mac及Linux平臺推出Chrome 136瀏覽器穩(wěn)定版，此次更新將在未來數(shù)周內逐步覆蓋全球用戶。最核心的改進是修復了一個存在超20年的隱私…

Google
4小時前
AI

?ChatGPT搜索上線網(wǎng)購功能：智能推薦+無廣告模式重新定義購物體驗

今日，OpenAI在X平臺宣布，ChatGPT搜索功能正式上線網(wǎng)購服務，覆蓋時尚、美妝、家居用品及電子產(chǎn)品等類目。用戶可通過自然提問獲取商品推薦，系統(tǒng)將同步展示產(chǎn)品詳情、用戶評價及…

AI
2天前
新聞

ChatGPT殺入電商賽道：一鍵直達商家頁面，免登錄也能買買買

OpenAI于4月29日宣布，即日起ChatGPT殺入電商賽道，所有用戶均可通過ChatGPT直接購買商品，無需注冊或登錄賬戶。用戶點擊對話界面新增的“購物按鈕”后，系統(tǒng)將基于歷史…

檸萌
2天前
新聞

?Android 16搶先劇透谷歌5月14日特別直播定檔

谷歌今日宣布將于北京時間2025年5月14日凌晨1點（美國太平洋時間5月13日10點）推出《The Android Show：I/O Edition》特別直播活動，由Android…

Google
2天前
商業(yè)

消息稱谷歌母公司一季度因SpaceX“躺賺”80億美元

據(jù)知情人士向媒體透露，谷歌母公司Alphabet今年第一季度財報中高達80億美元的未實現(xiàn)收益，源自對埃隆·馬斯克旗下太空探索技術公司（SpaceX）的股權投資。這一隱藏收益成為其季…

商業(yè)頭條
3天前
新聞

谷歌安卓16 Beta 4上線雙擊熄屏功能 Pixel用戶現(xiàn)可鎖屏快速關屏

谷歌在4月27日推送的安卓16 Beta 4更新中，為Pixel全系手機新增鎖屏界面雙擊熄屏功能。用戶無需喚醒設備，雙擊屏幕任意區(qū)域即可立即關閉顯示，該特性已向參與測試計劃的Pix…

Google
4天前
AI

OpenAI開放免費體驗！Deep Research輕量版AI搜索功能上線

人工智能公司OpenAI近日宣布，面向全體用戶推出輕量版Deep Research AI搜索功能。新功能基于o4-mini模型開發(fā)，免費用戶每月可獲得5次使用機會，付費用戶將根據(jù)訂…

AI
4天前
新聞

Google谷歌將于10月25日停止對早期Nest恒溫器的支持

谷歌Google本周宣布，從 10 月 25 日起，它將不再為第一代和第二代 Nest Learning Thermostats（Nest 學習型恒溫器）提供支持，也不會再發(fā)布相關…

科技探索者
4天前
新聞

?傳媒巨頭Ziff Davis起訴OpenAI：指控非法抓取數(shù)百萬文章訓練AI

據(jù)外媒報道稱，美國數(shù)字媒體集團Ziff Davis正式向紐約聯(lián)邦法院提起訴訟，指控人工智能公司OpenAI在未經(jīng)授權的情況下，“系統(tǒng)性復制”其旗下包括CNET、PCMag等45個媒…

小丸子
6天前
AI

OpenAI全面開放Deep Research：免費用戶首獲輕量版

今日，OpenAI宣布對其核心產(chǎn)品Deep Research進行重大升級。即日起，所有免費用戶均可使用輕量版服務，Plus、Team和Pro用戶則獲得更高頻次調用權限，而企業(yè)與教育…

AI
6天前
商業(yè)

谷歌母公司Alphabet一季度營收突破900億美元大關凈利潤激增46%

北京時間4月25日，谷歌母公司Alphabet發(fā)布2025財年首季財報，多項核心指標超越市場預期。數(shù)據(jù)顯示，公司季度營收達902.34億美元，同比增長12%（匯率調整后增長14%）…

Google
6天前
AI

?Gemini用戶半年激增3倍谷歌AI月活破3.5億緊追ChatGPT

根據(jù)谷歌反壟斷訴訟中最新披露的內部數(shù)據(jù)，其人工智能聊天機器人Gemini全球月活躍用戶數(shù)（MAU）在今年3月達到3.5億，較六個月前增長近3倍。這是谷歌首次公開該產(chǎn)品的用戶增長軌跡…

Google
2025年4月24日
AI

OpenAI計劃開源首款AI模型推理性能對標Meta、谷歌

近日，OpenAI正式確認將推出自2019年GPT-2以來的首個開源語言模型。據(jù)知情人士透露，該模型由研究副總裁Aidan Clark主導開發(fā)，計劃于今年夏季初發(fā)布，其核心目標是在…

AI
2025年4月24日
手機

因高額關稅谷歌Pixel越南產(chǎn)線考慮遷移至印度

面對美國持續(xù)加碼的關稅壓力，谷歌正啟動智能手機制造版圖調整。據(jù)印度《經(jīng)濟時報》披露，該公司計劃將Pixel手機生產(chǎn)基地從越南遷往印度，目前正與富士康、迪克森科技等代工企業(yè)磋商生產(chǎn)線…

Google
2025年4月23日
產(chǎn)品

OpenAI或將收購谷歌Chrome 反壟斷案庭審曝重磅合作內幕?

4月23日，美國司法部針對谷歌的反壟斷案庭審曝出驚人消息：OpenAI高管出庭作證稱，該公司曾試圖與谷歌達成搜索技術合作但遭拒絕，而司法部正推動強制拆分谷歌Chrome瀏覽器及數(shù)字…

科技探索者
2025年4月23日
AI

OpenAI o3及o4-mini模型被曝植入“隱形水印”：AI生成文本暗藏特殊符號

AI初創(chuàng)公司Rumi近日發(fā)布報告稱，OpenAI最新發(fā)布的o3及o4-mini模型中，其生成的文本內嵌入了特殊Unicode字符“窄不換行空格”（NNBSP，U+202F），疑似用…

AI
2025年4月22日
新聞

谷歌2億盧比和解印度反壟斷調查智能電視強制捆綁成歷史

印度競爭委員會（CCI）正式批準谷歌針對智能電視反壟斷指控的和解方案。根據(jù)協(xié)議，谷歌將支付2.024億盧比（約合1728.9萬元人民幣），并重構其在印度智能電視市場的服務授權體系?！?/p>

net
2025年4月22日
新聞

谷歌相冊推出Ultra HDR編輯神器：普通照片秒變高光大片

谷歌相冊（Google Photos）7.24.0.747539053版本近日開始向部分用戶推送全新“Ultra HDR”照片編輯功能。據(jù)用戶反饋及外媒Android Author…

Google
2025年4月21日
AI

OpenAI o3數(shù)學大模型遭”實測打假”：測試成績被指虛高

近日，人工智能領域再現(xiàn)基準測試爭議。OpenAI最新發(fā)布的o3大模型因第一方與第三方測試結果懸殊，陷入”成績注水”質疑。第三方機構實測顯示，該模型在權威數(shù)學…

AI
2025年4月21日
新聞

谷歌廣告壟斷坐實法院勒令拆分核心業(yè)務

當?shù)貢r間4月17日，美國弗吉尼亞州地方法院法官萊奧妮·布林克馬（Leonie Brinkema）裁定谷歌在線廣告市場存在非法壟斷行為，認定其通過捆綁銷售、數(shù)據(jù)壟斷及不公平競價規(guī)則打…

Google
2025年4月18日