蘋果開發(fā)出新款A(yù)I：能“看懂”屏幕上內(nèi)容并用語(yǔ)音回復(fù)

野游栗 ? 2024年4月7日 17:08:00 ? AI, 新聞

4月2日消息，蘋果公司的研究團(tuán)隊(duì)最近發(fā)表了一篇論文，宣布他們成功開發(fā)出了一款創(chuàng)新的人工智能系統(tǒng)。這個(gè)系統(tǒng)能夠準(zhǔn)確地理解屏幕上模糊的內(nèi)容及其相關(guān)對(duì)話和背景環(huán)境，進(jìn)而實(shí)現(xiàn)與語(yǔ)音助手更加自然的互動(dòng)。

這個(gè)系統(tǒng)被命名為ReALM（Reference Resolution As Language Modeling，即以語(yǔ)言建模為基礎(chǔ)的參考解析），它通過(guò)大語(yǔ)言模型的運(yùn)用，將理解屏幕視覺(jué)元素指向的復(fù)雜任務(wù)轉(zhuǎn)化為一個(gè)純粹的語(yǔ)言問(wèn)題。這一轉(zhuǎn)換使得ReALM在性能上相較于現(xiàn)有技術(shù)有了顯著的提升。

蘋果研究團(tuán)隊(duì)強(qiáng)調(diào)：“讓對(duì)話助手能夠理解上下文，包括相關(guān)的內(nèi)容指向，非常關(guān)鍵。能讓用戶根據(jù)他們所看到的屏幕內(nèi)容進(jìn)行提問(wèn)，是確保真正實(shí)現(xiàn)語(yǔ)音操作體驗(yàn)的重要一步?！?/p>

增強(qiáng)對(duì)話助手的能力

ReALM的一大創(chuàng)新在于它能夠重新構(gòu)建屏幕內(nèi)容，即通過(guò)分析屏幕上的信息及其位置信息來(lái)生成文本表示，這一點(diǎn)對(duì)捕捉視覺(jué)布局至關(guān)重要。研究人員展示了這種方法與專為內(nèi)容指向調(diào)整的語(yǔ)言模型結(jié)合起來(lái)，能在執(zhí)行相關(guān)任務(wù)時(shí)超越GPT-4的性能。

研究人員表示：“我們對(duì)現(xiàn)有系統(tǒng)進(jìn)行了顯著改進(jìn)，在處理多種類型的內(nèi)容指向時(shí)均展現(xiàn)出卓越性能。我們的最小模型就實(shí)現(xiàn)了超過(guò)5%的性能提升，而大型模型的表現(xiàn)則明顯超過(guò)了GPT-4?！?/p>

實(shí)際應(yīng)用與局限性

這項(xiàng)研究凸顯了專注于語(yǔ)言模型在處理如內(nèi)容指向解析等任務(wù)上的巨大潛力。由于響應(yīng)時(shí)間或計(jì)算資源的限制，大型端到端模型往往難以實(shí)施。通過(guò)這項(xiàng)創(chuàng)新性研究，蘋果展現(xiàn)了其持續(xù)投入，使Siri等產(chǎn)品在對(duì)話和理解上下文方面更加出色。

盡管如此，研究人員也指出，依靠自動(dòng)化解析屏幕內(nèi)容仍然面臨挑戰(zhàn)。在處理更復(fù)雜的視覺(jué)內(nèi)容，比如區(qū)分多個(gè)相似圖像時(shí)，可能需要結(jié)合計(jì)算機(jī)視覺(jué)和多模態(tài)技術(shù)。

努力縮小與AI競(jìng)爭(zhēng)對(duì)手差距

雖然在人工智能領(lǐng)域蘋果曾稍顯落后，但它正在默默取得顯著進(jìn)展。從融合視覺(jué)與語(yǔ)言的多模態(tài)模型，到開發(fā)AI驅(qū)動(dòng)的動(dòng)畫工具，再到構(gòu)建高性能的專業(yè)AI技術(shù)，蘋果的研究實(shí)驗(yàn)室持續(xù)實(shí)現(xiàn)技術(shù)突破。

面對(duì)谷歌、微軟、亞馬遜和OpenAI等公司的激烈競(jìng)爭(zhēng)——這些公司已在搜索、辦公軟件、云服務(wù)等領(lǐng)域推出了先進(jìn)的AI產(chǎn)品——作為一個(gè)以保密聞名的科技巨頭，蘋果正努力不落人后。

長(zhǎng)期以來(lái)，蘋果更多在創(chuàng)新領(lǐng)域扮演跟隨者而不是領(lǐng)先者的角色，現(xiàn)在正面臨著一個(gè)由人工智能快速改變的市場(chǎng)。在6月舉辦的全球開發(fā)者大會(huì)上，蘋果預(yù)計(jì)將推出新的大語(yǔ)言模型框架、“AppleGPT”聊天機(jī)器人及其生態(tài)系統(tǒng)中的其他AI功能。

“我們很高興今年晚些時(shí)候分享我們?cè)谌斯ぶ悄芊矫娴墓ぷ鬟M(jìn)展，”首席執(zhí)行官蒂姆·庫(kù)克（TimCook）最近在一次盈利電話會(huì)議上暗示。盡管蘋果向來(lái)低調(diào)，但其在AI領(lǐng)域的廣泛努力已經(jīng)引起了業(yè)界的廣泛關(guān)注。

然而，在日益激烈的人工智能領(lǐng)域競(jìng)爭(zhēng)中，蘋果的相對(duì)滯后使其處于不利地位。但憑借其雄厚的資金實(shí)力、品牌忠誠(chéng)度、一流的工程師團(tuán)隊(duì)和緊密整合的產(chǎn)品線，蘋果仍有機(jī)會(huì)扭轉(zhuǎn)局面。

本文轉(zhuǎn)載自：cnBeta，不代表科技訊之立場(chǎng)。原文鏈接：https://www.cnbeta.com.tw/articles/tech/1425875.htm

ReALM 人工智能蘋果

野游栗認(rèn)證作者

0 0

新聞

蘋果發(fā)布macOS 15.3開發(fā)者預(yù)覽版Beta 2

今日，蘋果針對(duì)Mac電腦用戶推送了macOS 15.3開發(fā)者預(yù)覽版Beta 2的更新。據(jù)了解，本次macOS 15.3開發(fā)者預(yù)覽版Beta 2的內(nèi)部版本號(hào)為24D5040f。距離上…

Apple
3小時(shí)前
新聞

蘋果發(fā)布iOS/iPadOS 18.3開發(fā)者預(yù)覽版Beta 2

今日，蘋果公司已正式推送了iOS/iPadOS 18.3開發(fā)者預(yù)覽版Beta 2的更新，這一更新為眾多期待嘗鮮的開發(fā)者提供了新的測(cè)試機(jī)會(huì)。據(jù)了解，本次更新的內(nèi)部版本號(hào)為22D504…

Apple
4小時(shí)前
新聞

蘋果推送iOS 18.2.1更新，重要錯(cuò)誤修復(fù)建議用戶盡快安裝

今日，蘋果公司正式向iPhone用戶推送了全新的iOS 18.2.1系統(tǒng)更新，此次更新的內(nèi)部版本號(hào)為22C161。距離上一次iOS正式版的發(fā)布，僅僅過(guò)去了26天的時(shí)間，蘋果再次以高…

Apple
1天前
手機(jī)

iPhone 16E型號(hào)名稱、顏色及設(shè)計(jì)細(xì)節(jié)曝光

近日，知名爆料人士Majin Bu在社交媒體X上發(fā)布了一系列關(guān)于即將發(fā)布的iPhone新機(jī)型的信息。據(jù)其透露，蘋果或?qū)⑼瞥雒麨閕Phone 16E的新機(jī)型，作為iPhone SE（…

Apple
2天前
經(jīng)驗(yàn)

蘋果鍵盤下一行行鍵是哪個(gè)鍵？一文讀懂換行與特殊功能的雙重角色

蘋果鍵盤“return”鍵基本功能是換行，但在特殊場(chǎng)景下可提交內(nèi)容或執(zhí)行其他操作，功能多樣且在同一應(yīng)用內(nèi)一致，體現(xiàn)了蘋果對(duì)用戶需求的深入理解及開發(fā)者靈活性。

科技探索者
2天前
經(jīng)驗(yàn)

蘋果后置攝像頭黑屏是什么原因？一文讀懂原因分析與解決策略

蘋果后置攝像頭黑屏可能因軟件故障、硬件問(wèn)題、物理?yè)p壞、電池問(wèn)題或系統(tǒng)資源不足導(dǎo)致，用戶需根據(jù)具體情況排查，必要時(shí)聯(lián)系專業(yè)維修人員。

潮玩君
2天前
經(jīng)驗(yàn)

蘋果強(qiáng)制刷機(jī)按哪幾個(gè)鍵？一文讀懂不同型號(hào)設(shè)備的操作方法詳解

蘋果設(shè)備遇系統(tǒng)問(wèn)題時(shí)，可強(qiáng)制刷機(jī)。不同型號(hào)設(shè)備進(jìn)入恢復(fù)/DFU模式步驟各異，需按型號(hào)操作。刷機(jī)前備份數(shù)據(jù)、下官方固件，確保連接穩(wěn)定，遵循指南。

科技探索者
3天前
經(jīng)驗(yàn)

蘋果ID密碼忘記了該怎么辦？一文讀懂多種方法幫你輕松找回

蘋果ID密碼忘記可通過(guò)蘋果設(shè)備、官網(wǎng)、“查找我的”功能、聯(lián)系客服或使用恢復(fù)模式找回。方法包括驗(yàn)證身份、重設(shè)密碼等，選擇適合的方式可輕松解決問(wèn)題。

科技探索者
3天前
AI

Encode提交法律意見書反對(duì)OpenAI營(yíng)利轉(zhuǎn)型

近日，針對(duì)人工智能初創(chuàng)企業(yè)OpenAI計(jì)劃轉(zhuǎn)型為完全營(yíng)利性公司的消息，反對(duì)聲音逐漸增強(qiáng)。本周一，Encode這一由年輕人主導(dǎo)的全球性倡導(dǎo)組織正式向法院遞交了一份法律意見書，明確支持…

AI
4天前
新聞

蘋果9500萬(wàn)美元和解Siri隱私訴訟：用戶每臺(tái)設(shè)備最高可獲賠20美元

今日，蘋果公司宣布同意支付9500萬(wàn)美元（約合6.96億元人民幣），以和解一項(xiàng)涉及Siri語(yǔ)音助手侵犯用戶隱私的集體訴訟。據(jù)了解，該訴訟指控Siri在用戶未預(yù)期的情況下啟用，并記…

Apple
5天前
產(chǎn)品

蘋果更新產(chǎn)品支持頁(yè)面：Apple Watch Series 4與MacBook Pro被歸入過(guò)時(shí)產(chǎn)品

昨日，蘋果公司正式更新了其產(chǎn)品支持頁(yè)面，宣布了兩款過(guò)時(shí)產(chǎn)品。據(jù)蘋果公司消息，Apple Watch Series 4智能手表已被列入過(guò)時(shí)產(chǎn)品名單。這款于2018年發(fā)布的產(chǎn)品，因距離…

Apple
5天前
手機(jī)

蘋果iPhone SE 4與iPhone 17 Slim外觀曝光：新設(shè)計(jì)引關(guān)注

近日，YouTube頻道TT Technology發(fā)布了蘋果iPhone SE 4與iPhone 17 Slim的最新渲染視頻，曝光了蘋果iPhone SE 4與iPhone 17…

Apple
5天前
新聞

蘋果中國(guó)宣布新年大促：1月4日至7日指定產(chǎn)品最高立減800元

近日，蘋果中國(guó)官網(wǎng)正式發(fā)布公告，宣布將于2025年1月4日至7日舉辦新年促銷活動(dòng)。此次活動(dòng)覆蓋iPhone、Mac、iPad、Apple Watch、AirPods及Apple P…

Apple
6天前
產(chǎn)品

iOS 19支援機(jī)型：將全面兼容舊款iPhone

據(jù)法國(guó)知名科技網(wǎng)站iPhoneSoft.fr的最新報(bào)道，蘋果公司的下一代操作系統(tǒng)iOS 19將不會(huì)放棄對(duì)任何現(xiàn)有iPhone型號(hào)的支持。報(bào)道指出，iOS 19系統(tǒng)將全面兼容能夠運(yùn)…

Apple
2024年12月31日
新聞

臺(tái)積電計(jì)劃量產(chǎn)2nm制程，iPhone 17或無(wú)緣首批采用

據(jù)最新消息，全球領(lǐng)先的半導(dǎo)體代工廠商臺(tái)積電計(jì)劃于明年開始量產(chǎn)2nm制程芯片。然而，盡管蘋果一直以來(lái)都追求最出色的工藝制程，但其下一代旗艦手機(jī)iPhone 17或許將無(wú)法首批采用這一…

泡沫大盜
2024年12月27日
新聞

蘋果2025上半年新品爆發(fā)：由iPhone SE 4領(lǐng)銜

近日，有外媒曝光了蘋果2025上半年新品的消息。據(jù)了解，蘋果計(jì)劃在2025年上半年推出包括iPhone SE 4在內(nèi)的五款新品，這些產(chǎn)品將覆蓋蘋果的大部分品類，包括PC、平板、手機(jī)…

Apple
2024年12月27日
新聞

蘋果官宣Apple TV+將迎“新驚喜”，時(shí)間定為2025年1月4-5日

今日，蘋果公司在其官方X平臺(tái)上宣布，將于2025年1月4日至1月5日為Apple TV+服務(wù)帶來(lái)“新驚喜”。目前，關(guān)于這一“新驚喜”的具體內(nèi)容，蘋果公司并未透露過(guò)多信息。據(jù)了解，…

Apple
2024年12月27日
新聞

蘋果日本新年大促來(lái)襲：指定產(chǎn)品贈(zèng)高達(dá)3萬(wàn)日元禮券

近日，蘋果公司宣布在日本啟動(dòng)新年促銷活動(dòng)，為用戶帶來(lái)豐厚福利。據(jù)了解，該活動(dòng)將于1月2日正式開啟，持續(xù)至1月5日，為期4天。在促銷期間，用戶購(gòu)買指定蘋果產(chǎn)品，將有機(jī)會(huì)獲得價(jià)值高達(dá)…

Apple
2024年12月27日
新聞

CES 2025前瞻：人工智能成亮點(diǎn)

隨著假日季的逐漸升溫，科技界的目光已經(jīng)開始聚焦于即將到來(lái)的CES 2025展會(huì)。據(jù)了解，眾多科技巨頭已蓄勢(shì)待發(fā)，準(zhǔn)備在展會(huì)上展示其最新研發(fā)的創(chuàng)新產(chǎn)品。本次展會(huì)，人工智能預(yù)計(jì)將成為…

NEWS
2024年12月26日
手機(jī)

iPhone 17系列顯示屏概念圖曝光：靈動(dòng)島更小

近日，關(guān)于蘋果即將推出的iPhone 17系列傳聞的消息再度引發(fā)關(guān)注。據(jù)外媒最新報(bào)道，iPhone 17系列的前置顯示屏概念圖已經(jīng)流出，展示了該系列新機(jī)在設(shè)計(jì)上的兩大看點(diǎn)：更窄的邊…

Apple
2024年12月26日

發(fā)表回復(fù)

登錄后才能評(píng)論

蘋果開發(fā)出新款A(yù)I：能“看懂”屏幕上內(nèi)容并用語(yǔ)音回復(fù)

相關(guān)推薦

發(fā)表回復(fù)