蘋果展示AI新模型MGIE 可一句話精修圖片

科技探索者 ? 2024年2月8日 16:25:00 ? 新聞

MGIE 的全稱是 MLLM-Guided Image Editing，利用多模態(tài)大型語言模型（MLLM）解釋用戶指令并執(zhí)行像素級操作。MGIE 可以理解用戶下達(dá)的自然語言命令，進(jìn)行 Photoshop 風(fēng)格的修改、全局照片優(yōu)化和局部編輯等操作。

2 月 8 日消息，相比較微軟的風(fēng)生水起，蘋果公司在 AI 領(lǐng)域的布局顯得低調(diào)很多，但這并不意味著蘋果在該領(lǐng)域就沒有絲毫建樹。蘋果公司近日發(fā)布了名為“MGIE”的新型開源人工智能模型，它可以根據(jù)自然語言指令編輯圖像。

蘋果公司和加州大學(xué)圣巴巴拉分校研究人員合作，在 2024 年國際學(xué)習(xí)表征會議（ICLR）上發(fā)表 MGIE 相關(guān)研究成果，而 ICLR 是人工智能研究的頂級會議之一。

介紹 MGIE 之前，IT之家先來介紹下 MLLM。MLLM 是一種強(qiáng)大的人工智能模型，可以同時(shí)處理文本和圖像，從而增強(qiáng)基于指令的圖像編輯能力。MLLMs 在跨模態(tài)理解和視覺感知響應(yīng)生成方面表現(xiàn)出卓越的能力，但尚未廣泛應(yīng)用于圖像編輯任務(wù)。

MGIE 通過兩種方式將 MLLMs 集成到圖像編輯過程中：首先，它使用 MLLMs 從用戶輸入中推導(dǎo)出富有表現(xiàn)力的指令。這些指令簡潔明了，為編輯過程提供了明確的指導(dǎo)。

例如，當(dāng)輸入“讓天空更藍(lán)”時(shí)，MGIE 可以生成“將天空區(qū)域的飽和度提高 20%”的指令。

其次，它使用 MLLM 生成視覺想象力，即所需編輯的潛在表征。這一表征捕捉了編輯的本質(zhì)，可用于指導(dǎo)像素級操作。MGIE 采用了一種新穎的端到端訓(xùn)練方案，可聯(lián)合優(yōu)化指令推導(dǎo)、視覺想象和圖像編輯模塊。

MGIE 可以處理各種編輯情況，從簡單的顏色調(diào)整到復(fù)雜的對象操作。該模型還可以根據(jù)用戶的偏好執(zhí)行全局和局部編輯。MGIE 的部分特性和功能包括：

基于指令的表達(dá)式編輯：MGIE 可以生成簡潔明了的說明，有效指導(dǎo)編輯過程。這不僅能提高編輯質(zhì)量，還能增強(qiáng)用戶的整體體驗(yàn)。

Photoshop 風(fēng)格修改：MGIE 可以執(zhí)行常見的 Photoshop 風(fēng)格編輯，如裁剪、調(diào)整大小、旋轉(zhuǎn)、翻轉(zhuǎn)和添加濾鏡。該模型還可以應(yīng)用更高級的編輯，如更改背景、添加或刪除對象以及混合圖像。

全局照片優(yōu)化：MGIE 可以優(yōu)化照片的整體質(zhì)量，如亮度、對比度、清晰度和色彩平衡。該模型還能應(yīng)用素描、繪畫和漫畫等藝術(shù)效果。

局部編輯：MGIE 可以編輯圖像中的特定區(qū)域或?qū)ο?，如臉部、眼睛、頭發(fā)、衣服和配飾。模型還可以修改這些區(qū)域或?qū)ο蟮膶傩?，如形狀、大小、顏色、紋理和風(fēng)格。

MGIE 是 GitHub 上的一個(gè)開源項(xiàng)目，用戶可以在這里找到代碼、數(shù)據(jù)和預(yù)訓(xùn)練模型。該項(xiàng)目還提供了一個(gè)演示筆記本，展示如何使用 MGIE 完成各種編輯任務(wù)。

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/629359.html

科技探索者管理團(tuán)隊(duì)

0 0

新聞

蘋果宣布iPhone SE 3、iPhone 14及14 Plus在歐盟停售

近日，因應(yīng)歐盟新規(guī)定，iPhone SE 3、iPhone 14及iPhone 14 Plus即日起在歐盟范圍內(nèi)將逐漸停產(chǎn)并停止銷售。目前，瑞士蘋果官網(wǎng)已顯示這三款機(jī)型全部缺貨。值…

Apple
23小時(shí)前
AI

北美監(jiān)管機(jī)構(gòu)警告：AI應(yīng)用激增或致明年大面積停電

隨著蘋果iOS 18.2系統(tǒng)的公開發(fā)布，Apple Intelligence的多項(xiàng)新功能正式亮相。然而，北美電力可靠性公司（NERC）近日卻發(fā)出了一項(xiàng)令人擔(dān)憂的警告。據(jù)《金融時(shí)報(bào)》…

AI
2天前
新聞

蘋果發(fā)布iOS/iPadOS 18.3及macOS 15.3公測版

今日，蘋果公司正式推出了iOS 18.3、iPadOS 18.3以及macOS Sequoia 15.3的首個(gè)公開測試版，為即將到來的正式版提前預(yù)熱。用戶只需通過蘋果的公共Bet…

Apple
3天前
新聞

Cloudflare：2024 年全球互聯(lián)網(wǎng)流量同比增長 17.2%，美國仍是主要 Bot 流量來源地

Cloudflare報(bào)告2024年全球互聯(lián)網(wǎng)流量增17.2%，谷歌領(lǐng)跑，美國Bot流量最大。IPv6流量下降，移動設(shè)備流量占41.3%，Chrome瀏覽器領(lǐng)先。西班牙網(wǎng)速最快。

潮玩君
3天前
新聞

拼多多 Temu 連續(xù)兩年成美國下載量最大的免費(fèi)蘋果 iOS 應(yīng)用，TikTok 第三

蘋果發(fā)布AppStore年度榜單，Temu蟬聯(lián)美免費(fèi)應(yīng)用下載冠軍，TikTok第三，ChatGPT第四超越谷歌搜索，Meta應(yīng)用排名下降，但Threads第二，Instagram和WhatsApp分列第六和第七。

科技探索者
3天前
新聞

IDC：2024 年前三季度全球腕戴設(shè)備市場出貨 1.4 億臺同比降 1.0%，華為、蘋果、小米前三

2024年前三季度全球腕戴設(shè)備出貨1.4億臺，同比降1.0%。中國出貨4576萬臺，增20.1%。華為全球腕戴出貨量第一，蘋果智能手表領(lǐng)先，小米、三星、步步高市場表現(xiàn)各異。

潮玩君
3天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項(xiàng)開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
3天前
手機(jī)

iPhone或迎六年來首次設(shè)計(jì)大換代，全新渲染圖曝光

近日，網(wǎng)絡(luò)上曝光了一組關(guān)于iPhone 17 Pro Max渲染圖，展示了蘋果下一代旗艦手機(jī)的潛在設(shè)計(jì)。據(jù)悉，這是自iPhone 11系列以來，蘋果首次對其手機(jī)背部設(shè)計(jì)進(jìn)行重大更新…

Apple
3天前
新聞

Apple揭曉2024年度臺灣App Store熱門榜單：咻咻封神獲免費(fèi)游戲下載冠軍

隨著2024年的即將結(jié)束，Apple公司公布了本年度臺灣App Store下載次數(shù)最多的應(yīng)用和游戲榜單。在免費(fèi)應(yīng)用方面，由Meta推出的新社群平臺Threads憑借其快速增長的用…

Apple
3天前
商業(yè)

英偉達(dá)股價(jià)持續(xù)下滑，投資者擔(dān)憂AI支出前景

近日，英偉達(dá)股價(jià)持續(xù)呈現(xiàn)下跌趨勢，周二再跌1.2%，引發(fā)了市場的廣泛關(guān)注。這家全球領(lǐng)先的人工智能芯片制造商的股價(jià)，已從11月初的歷史高峰148.88美元下跌了約12%。據(jù)了解，投…

商業(yè)頭條
4天前
手機(jī)

iPhone 17 Air售價(jià)曝光：價(jià)格或?qū)⒏?

據(jù)媒體消息，自明年起，iPhone 17 Air將加入蘋果手機(jī)家族，替代Plus機(jī)型?，F(xiàn)在有爆料指出，iPhone 17 Air最終定價(jià)預(yù)計(jì)與iPhone 16 Plus的起售價(jià)相…

Apple
4天前
新聞

蘋果推送macOS 15.3開發(fā)者預(yù)覽版Beta更新，引入Genmoji功能

今日，蘋果向Mac電腦用戶推送了macOS 15.3開發(fā)者預(yù)覽版Beta更新，其內(nèi)部版本號為24D5034，此次更新距離上次發(fā)布Beta/RC版本間隔了7天。據(jù)了解，macOS …

蘋果派
4天前
新聞

蘋果推送visionOS 2.3開發(fā)者預(yù)覽版Beta更新

蘋果公司于今日正式向Vision Pro用戶推送了visionOS 2.3開發(fā)者預(yù)覽版Beta更新，內(nèi)部版本號為22N5875e。據(jù)了解，距離上一次Beta或RC版本的發(fā)布。目前…

Apple
4天前
新聞

蘋果推送watchOS 11.3開發(fā)者預(yù)覽版Beta更新

今日，蘋果向Apple Watch用戶推送了watchOS 11.3開發(fā)者預(yù)覽版Beta更新，其內(nèi)部版本號為22S5534d。此次更新距離上次發(fā)布Beta/RC版本間隔了11天。 …

蘋果派
5天前
新聞

蘋果推送iOS 18.3開發(fā)者預(yù)覽版Beta更新

今日，蘋果公司向廣大iPhone用戶推送了全新的iOS 18.3開發(fā)者預(yù)覽版Beta更新，此次更新的內(nèi)部版本號為22D5034e。值得注意的是，距離上一次Beta或RC版本的發(fā)布，…

Apple
5天前
手機(jī)

蘋果計(jì)劃推出超薄iPhone 17 Air及可折疊設(shè)備

近日，《華爾街日報(bào)》記者Aaron Tilley和Yang Jie發(fā)布報(bào)道，透露了蘋果公司即將在未來幾年對iPhone進(jìn)行的一系列重大設(shè)計(jì)與形式變更。報(bào)道指出，備受關(guān)注的iPho…

Apple
5天前
AI

月之暗面發(fā)布k1視覺思考模型，支持多領(lǐng)域圖像理解

今日，人工智能公司月之暗面宣布發(fā)布其最新的k1視覺思考模型。該模型基于強(qiáng)化學(xué)習(xí)技術(shù)，不僅在數(shù)學(xué)領(lǐng)域表現(xiàn)突出，還擴(kuò)展到了物理、化學(xué)等基礎(chǔ)科學(xué)領(lǐng)域，展現(xiàn)出強(qiáng)大的圖像理解和思維鏈能力。 …

AI
5天前
經(jīng)驗(yàn)

蘋果鎖屏?xí)r間變暗了怎么辦？一文讀懂全方位解決方法

蘋果鎖屏?xí)r間變暗，可調(diào)亮度、優(yōu)化鎖屏?xí)r間、關(guān)自動亮度、關(guān)低電量模式、更新軟件、清應(yīng)用緩存、查第三方應(yīng)用，終極可還原設(shè)置或?qū)I(yè)維修。

潮玩君
2024年12月15日
經(jīng)驗(yàn)

iPhone 18 Pro或首發(fā)2nm芯片：漲價(jià)70%背后的行業(yè)變革

蘋果iPhone18Pro將搭2nm A20Pro處理器，芯片價(jià)漲70%致手機(jī)或漲價(jià)。2nm制程技術(shù)提升性能但成本高昂，影響行業(yè)趨勢和消費(fèi)者選擇，需權(quán)衡性能與價(jià)格。行業(yè)需技術(shù)創(chuàng)新與成本控制并重。

潮玩君
2024年12月14日
AI

谷歌發(fā)布Gemini 2.0模型及Deep Research新功能

谷歌官方近日宣布，正式推出其最新一代人工智能模型——Gemini 2.0。據(jù)了解，自當(dāng)?shù)貢r(shí)間12月11日起，谷歌已將Gemini 2.0開放給開發(fā)者及受信任的測試人員，并正積極推進(jìn)…

Google
2024年12月13日

發(fā)表回復(fù)

登錄后才能評論

蘋果展示AI新模型MGIE 可一句話精修圖片

相關(guān)推薦

發(fā)表回復(fù)