蘋果Apple推出MGIE:用語言描述即可編輯圖像的人工智能AI工具

蘋果Apple推出MGIE:用語言描述即可編輯圖像的人工智能AI工具

人工智能AI的浪潮中,圖像編輯技術(shù)正迎來一場革命。蘋果Apple公司與加州大學(xué)圣巴巴拉分校合作開發(fā)的MGIE(MLLM引導(dǎo)圖像編輯)模型,便是這場革命的最新成果。這款工具允許用戶通過簡單的語言描述來編輯照片,無需接觸復(fù)雜的圖像編輯軟件。

MGIE模型的強(qiáng)大之處在于其多模態(tài)語言模型的應(yīng)用。首先,它能夠?qū)W習(xí)并理解用戶的語言提示,然后“想象”出編輯后的效果。這意味著,用戶只需告訴MGIE他們想要更改的內(nèi)容,比如“讓天空更藍(lán)”或“添加更多對比度以模擬更多光線”,MGIE便能自動(dòng)對照片進(jìn)行相應(yīng)的編輯。

這一過程的實(shí)現(xiàn)離不開蘋果在機(jī)器學(xué)習(xí)領(lǐng)域的深厚積累。通過訓(xùn)練,MGIE模型已經(jīng)能夠準(zhǔn)確地解釋并執(zhí)行各種編輯指令,無論是簡單的裁剪、調(diào)整大小,還是更復(fù)雜的對象修改和濾鏡添加。

為了展示MGIE的能力,研究人員在論文中使用了一些生動(dòng)的示例。比如,當(dāng)用戶對一張意大利辣香腸披薩的照片輸入提示“使其更健康”時(shí),MGIE會(huì)自動(dòng)在披薩上添加蔬菜配料。又如,一張?jiān)净璋档娜龉匣⒄掌谳斎搿疤砑痈鄬Ρ榷纫阅M更多光線”后,變得明亮而生動(dòng)。

這些示例不僅展示了MGIE的實(shí)用性,也證明了其在保持高效的同時(shí),能夠顯著提高圖像編輯的性能。研究人員表示,MGIE不是簡單地執(zhí)行模糊的指導(dǎo),而是能夠準(zhǔn)確理解用戶的視覺感知意圖,并產(chǎn)生合理的編輯效果。

值得一提的是,蘋果并不是生成人工智能領(lǐng)域的傳統(tǒng)強(qiáng)手。與微軟、Meta或谷歌等巨頭相比,蘋果在AI領(lǐng)域的布局相對保守。然而,隨著MGIE等創(chuàng)新工具的推出,以及蘋果首席執(zhí)行官蒂姆·庫克對增加更多AI功能的承諾,我們可以看到蘋果在人工智能領(lǐng)域的野心正在逐步顯現(xiàn)。

去年12月,蘋果發(fā)布了名為MLX的開源機(jī)器學(xué)習(xí)框架,旨在簡化在Apple Silicon芯片上訓(xùn)練AI模型的過程。這一舉措不僅降低了AI技術(shù)的門檻,也為開發(fā)者提供了更多創(chuàng)新的可能性。

當(dāng)然,MGIE模型的推出并不意味著其他圖像編輯工具將黯然失色。事實(shí)上,像Adobe這樣的行業(yè)巨頭也在積極探索AI技術(shù)在圖像編輯領(lǐng)域的應(yīng)用。其Firefly AI模型便是一個(gè)很好的例子,它支持生成填充功能,可以將生成的背景自然地添加到照片中。

總的來說,MGIE是蘋果在人工智能領(lǐng)域的一次重要嘗試,它不僅提升了圖像編輯的便捷性和效率,也為我們展示了AI技術(shù)在創(chuàng)意表達(dá)方面的無限潛力。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,我們有理由相信,未來的圖像編輯將更加智能、直觀和富有創(chuàng)意。

原創(chuàng)文章,作者:檸萌,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/629258.html

檸萌的頭像檸萌管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論