蘋果Apple推出MGIE：用語言描述即可編輯圖像的人工智能AI工具

檸萌 ? 2024年2月8日 08:08:00 ? AI

在人工智能AI的浪潮中，圖像編輯技術(shù)正迎來一場革命。蘋果Apple公司與加州大學圣巴巴拉分校合作開發(fā)的MGIE（MLLM引導圖像編輯）模型，便是這場革命的最新成果。這款工具允許用戶通過簡單的語言描述來編輯照片，無需接觸復雜的圖像編輯軟件。

MGIE模型的強大之處在于其多模態(tài)語言模型的應(yīng)用。首先，它能夠?qū)W習并理解用戶的語言提示，然后“想象”出編輯后的效果。這意味著，用戶只需告訴MGIE他們想要更改的內(nèi)容，比如“讓天空更藍”或“添加更多對比度以模擬更多光線”，MGIE便能自動對照片進行相應(yīng)的編輯。

這一過程的實現(xiàn)離不開蘋果在機器學習領(lǐng)域的深厚積累。通過訓練，MGIE模型已經(jīng)能夠準確地解釋并執(zhí)行各種編輯指令，無論是簡單的裁剪、調(diào)整大小，還是更復雜的對象修改和濾鏡添加。

為了展示MGIE的能力，研究人員在論文中使用了一些生動的示例。比如，當用戶對一張意大利辣香腸披薩的照片輸入提示“使其更健康”時，MGIE會自動在披薩上添加蔬菜配料。又如，一張原本昏暗的撒哈拉老虎照片，在輸入“添加更多對比度以模擬更多光線”后，變得明亮而生動。

這些示例不僅展示了MGIE的實用性，也證明了其在保持高效的同時，能夠顯著提高圖像編輯的性能。研究人員表示，MGIE不是簡單地執(zhí)行模糊的指導，而是能夠準確理解用戶的視覺感知意圖，并產(chǎn)生合理的編輯效果。

值得一提的是，蘋果并不是生成人工智能領(lǐng)域的傳統(tǒng)強手。與微軟、Meta或谷歌等巨頭相比，蘋果在AI領(lǐng)域的布局相對保守。然而，隨著MGIE等創(chuàng)新工具的推出，以及蘋果首席執(zhí)行官蒂姆·庫克對增加更多AI功能的承諾，我們可以看到蘋果在人工智能領(lǐng)域的野心正在逐步顯現(xiàn)。

去年12月，蘋果發(fā)布了名為MLX的開源機器學習框架，旨在簡化在Apple Silicon芯片上訓練AI模型的過程。這一舉措不僅降低了AI技術(shù)的門檻，也為開發(fā)者提供了更多創(chuàng)新的可能性。

當然，MGIE模型的推出并不意味著其他圖像編輯工具將黯然失色。事實上，像Adobe這樣的行業(yè)巨頭也在積極探索AI技術(shù)在圖像編輯領(lǐng)域的應(yīng)用。其Firefly AI模型便是一個很好的例子，它支持生成填充功能，可以將生成的背景自然地添加到照片中。

總的來說，MGIE是蘋果在人工智能領(lǐng)域的一次重要嘗試，它不僅提升了圖像編輯的便捷性和效率，也為我們展示了AI技術(shù)在創(chuàng)意表達方面的無限潛力。隨著技術(shù)的不斷進步和應(yīng)用場景的不斷拓展，我們有理由相信，未來的圖像編輯將更加智能、直觀和富有創(chuàng)意。

原創(chuàng)文章，作者：檸萌，如若轉(zhuǎn)載，請注明出處：http://2079x.cn/article/629258.html

檸萌管理團隊

0 0

新聞

蘋果宣布iPhone SE 3、iPhone 14及14 Plus在歐盟停售

近日，因應(yīng)歐盟新規(guī)定，iPhone SE 3、iPhone 14及iPhone 14 Plus即日起在歐盟范圍內(nèi)將逐漸停產(chǎn)并停止銷售。目前，瑞士蘋果官網(wǎng)已顯示這三款機型全部缺貨。值…

Apple
23小時前
AI

北美監(jiān)管機構(gòu)警告：AI應(yīng)用激增或致明年大面積停電

隨著蘋果iOS 18.2系統(tǒng)的公開發(fā)布，Apple Intelligence的多項新功能正式亮相。然而，北美電力可靠性公司（NERC）近日卻發(fā)出了一項令人擔憂的警告。據(jù)《金融時報》…

AI
2天前
新聞

蘋果發(fā)布iOS/iPadOS 18.3及macOS 15.3公測版

今日，蘋果公司正式推出了iOS 18.3、iPadOS 18.3以及macOS Sequoia 15.3的首個公開測試版，為即將到來的正式版提前預(yù)熱。用戶只需通過蘋果的公共Bet…

Apple
2天前
新聞

Cloudflare：2024 年全球互聯(lián)網(wǎng)流量同比增長 17.2%，美國仍是主要 Bot 流量來源地

Cloudflare報告2024年全球互聯(lián)網(wǎng)流量增17.2%，谷歌領(lǐng)跑，美國Bot流量最大。IPv6流量下降，移動設(shè)備流量占41.3%，Chrome瀏覽器領(lǐng)先。西班牙網(wǎng)速最快。

潮玩君
3天前
新聞

拼多多 Temu 連續(xù)兩年成美國下載量最大的免費蘋果 iOS 應(yīng)用，TikTok 第三

蘋果發(fā)布AppStore年度榜單，Temu蟬聯(lián)美免費應(yīng)用下載冠軍，TikTok第三，ChatGPT第四超越谷歌搜索，Meta應(yīng)用排名下降，但Threads第二，Instagram和WhatsApp分列第六和第七。

科技探索者
3天前
新聞

IDC：2024 年前三季度全球腕戴設(shè)備市場出貨 1.4 億臺同比降 1.0%，華為、蘋果、小米前三

2024年前三季度全球腕戴設(shè)備出貨1.4億臺，同比降1.0%。中國出貨4576萬臺，增20.1%。華為全球腕戴出貨量第一，蘋果智能手表領(lǐng)先，小米、三星、步步高市場表現(xiàn)各異。

潮玩君
3天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
3天前
手機

iPhone或迎六年來首次設(shè)計大換代，全新渲染圖曝光

近日，網(wǎng)絡(luò)上曝光了一組關(guān)于iPhone 17 Pro Max渲染圖，展示了蘋果下一代旗艦手機的潛在設(shè)計。據(jù)悉，這是自iPhone 11系列以來，蘋果首次對其手機背部設(shè)計進行重大更新…

Apple
3天前
新聞

Apple揭曉2024年度臺灣App Store熱門榜單：咻咻封神獲免費游戲下載冠軍

隨著2024年的即將結(jié)束，Apple公司公布了本年度臺灣App Store下載次數(shù)最多的應(yīng)用和游戲榜單。在免費應(yīng)用方面，由Meta推出的新社群平臺Threads憑借其快速增長的用…

Apple
3天前
商業(yè)

英偉達股價持續(xù)下滑，投資者擔憂AI支出前景

近日，英偉達股價持續(xù)呈現(xiàn)下跌趨勢，周二再跌1.2%，引發(fā)了市場的廣泛關(guān)注。這家全球領(lǐng)先的人工智能芯片制造商的股價，已從11月初的歷史高峰148.88美元下跌了約12%。據(jù)了解，投…

商業(yè)頭條
4天前
手機

iPhone 17 Air售價曝光：價格或?qū)⒏?

據(jù)媒體消息，自明年起，iPhone 17 Air將加入蘋果手機家族，替代Plus機型?，F(xiàn)在有爆料指出，iPhone 17 Air最終定價預(yù)計與iPhone 16 Plus的起售價相…

Apple
4天前
新聞

蘋果推送macOS 15.3開發(fā)者預(yù)覽版Beta更新，引入Genmoji功能

今日，蘋果向Mac電腦用戶推送了macOS 15.3開發(fā)者預(yù)覽版Beta更新，其內(nèi)部版本號為24D5034，此次更新距離上次發(fā)布Beta/RC版本間隔了7天。據(jù)了解，macOS …

蘋果派
4天前
新聞

蘋果推送visionOS 2.3開發(fā)者預(yù)覽版Beta更新

蘋果公司于今日正式向Vision Pro用戶推送了visionOS 2.3開發(fā)者預(yù)覽版Beta更新，內(nèi)部版本號為22N5875e。據(jù)了解，距離上一次Beta或RC版本的發(fā)布。目前…

Apple
4天前
新聞

蘋果推送watchOS 11.3開發(fā)者預(yù)覽版Beta更新

今日，蘋果向Apple Watch用戶推送了watchOS 11.3開發(fā)者預(yù)覽版Beta更新，其內(nèi)部版本號為22S5534d。此次更新距離上次發(fā)布Beta/RC版本間隔了11天。 …

蘋果派
4天前
新聞

蘋果推送iOS 18.3開發(fā)者預(yù)覽版Beta更新

今日，蘋果公司向廣大iPhone用戶推送了全新的iOS 18.3開發(fā)者預(yù)覽版Beta更新，此次更新的內(nèi)部版本號為22D5034e。值得注意的是，距離上一次Beta或RC版本的發(fā)布，…

Apple
5天前
手機

蘋果計劃推出超薄iPhone 17 Air及可折疊設(shè)備

近日，《華爾街日報》記者Aaron Tilley和Yang Jie發(fā)布報道，透露了蘋果公司即將在未來幾年對iPhone進行的一系列重大設(shè)計與形式變更。報道指出，備受關(guān)注的iPho…

Apple
5天前
AI

月之暗面發(fā)布k1視覺思考模型，支持多領(lǐng)域圖像理解

今日，人工智能公司月之暗面宣布發(fā)布其最新的k1視覺思考模型。該模型基于強化學習技術(shù)，不僅在數(shù)學領(lǐng)域表現(xiàn)突出，還擴展到了物理、化學等基礎(chǔ)科學領(lǐng)域，展現(xiàn)出強大的圖像理解和思維鏈能力。 …

AI
5天前
經(jīng)驗

蘋果鎖屏時間變暗了怎么辦？一文讀懂全方位解決方法

蘋果鎖屏時間變暗，可調(diào)亮度、優(yōu)化鎖屏時間、關(guān)自動亮度、關(guān)低電量模式、更新軟件、清應(yīng)用緩存、查第三方應(yīng)用，終極可還原設(shè)置或?qū)I(yè)維修。

潮玩君
6天前
經(jīng)驗

iPhone 18 Pro或首發(fā)2nm芯片：漲價70%背后的行業(yè)變革

蘋果iPhone18Pro將搭2nm A20Pro處理器，芯片價漲70%致手機或漲價。2nm制程技術(shù)提升性能但成本高昂，影響行業(yè)趨勢和消費者選擇，需權(quán)衡性能與價格。行業(yè)需技術(shù)創(chuàng)新與成本控制并重。

潮玩君
2024年12月14日
AI

谷歌發(fā)布Gemini 2.0模型及Deep Research新功能

谷歌官方近日宣布，正式推出其最新一代人工智能模型——Gemini 2.0。據(jù)了解，自當?shù)貢r間12月11日起，谷歌已將Gemini 2.0開放給開發(fā)者及受信任的測試人員，并正積極推進…

Google
2024年12月13日

發(fā)表回復

登錄后才能評論

蘋果Apple推出MGIE：用語言描述即可編輯圖像的人工智能AI工具

相關(guān)推薦

發(fā)表回復