在官宣“蘋果智能”(Apple Intelligence)一個多月后,蘋果的這一人工智能(AI)系統(tǒng)終于在終端設(shè)備上得以實現(xiàn)。美東時間7月29日,蘋果發(fā)布了蘋果智能的首個iPhone AI版本,現(xiàn)已在iOS 18.1開發(fā)者測試版中上線,僅向每年支付99美元/年的注冊開發(fā)者開放,但此次更新僅帶來了部分功能,包括Siri升級、寫作工具和照片管理等。其他如屏幕感知、AI圖像生成等功能暫時無法使用。
蘋果表示,更多功能更新將于明年正式上線。本次更新僅支持配備M系列和A17 Pro芯片的設(shè)備,即在iPhone上僅適用于iPhone 15 Pro和iPhone 15 Pro Max,iPad和Mac也有類似的版本。開發(fā)者的設(shè)備區(qū)域需設(shè)置為美國,語言需為英語。
Apple Intelligence的首個版本已經(jīng)上線,包括Siri升級、寫作工具、郵件提要和照片搜索等功能。蘋果還發(fā)布了其自研大模型技術(shù)報告,詳細介紹了30億參數(shù)的端側(cè)模型AFM-on-device和云端模型AFM-server。這些模型在指令遵循和文本總結(jié)方面的測試表現(xiàn)優(yōu)于GPT-4。其具體升級分析在下文分別介紹。
1. Siri的智能升級
Siri在此次更新中迎來了重大改變,Apple Intelligence賦予其更強大的能力和全新的外觀。新的Siri不再是過去的球形圖標(biāo),而是環(huán)繞屏幕的炫彩發(fā)光特效,視覺效果更具科技感。用戶可以通過雙擊iPhone屏幕底部來調(diào)出文本輸入界面,與Siri進行文字交流。
全新的Siri能夠根據(jù)上下文進行連續(xù)對話,理解用戶不通順的指令,并且能回答有關(guān)設(shè)備功能和設(shè)置的問題。這使得Siri的使用體驗比之前更為便捷,但仍未完全達到WWDC上宣傳的高度。
2. 強大的文本工具
文本工具是此次更新的重要亮點之一,幾乎支持所有涉及文本輸入的原生和第三方應(yīng)用。主要功能包括校對、重寫和總結(jié)。用戶可以校對選中文本的拼寫和語法錯誤,進行重寫以潤色文章,并對文本進行總結(jié)。此外,文本工具還將在郵件和信息處理中發(fā)揮作用,例如總結(jié)用戶收到的電子郵件并提供智能回復(fù)選項。雖然這些功能不能從零生成文本,但其便捷性和實用性無疑提升了用戶的文字處理效率。
3. 照片和通話錄音功能
焦點模式可過濾不重要的通知,顯示用戶當(dāng)前最需要的通知,如乘車到達等。照片功能支持自然語言創(chuàng)建幻燈片和搜索照片,并涵蓋視頻內(nèi)容。通話錄音功能在此次更新中也得以實現(xiàn)。用戶可以在通話時點擊屏幕左上角的小錄音按鈕,錄制內(nèi)容將存儲在備忘錄中,用戶可以查看錄音并生成摘要。然而,錄音生成摘要功能暫時不支持國行手機。
值得一提的是,蘋果基礎(chǔ)模型的訓(xùn)練采用了谷歌設(shè)計的TPU(張量處理單元),而非廣泛使用的英偉達GPU。蘋果的技術(shù)報告指出,云側(cè)使用了8192顆TPUv4芯片,端側(cè)使用了2048顆TPUv5p芯片。這一決定令人驚訝,因為英偉達GPU一直是訓(xùn)練大規(guī)模AI模型的首選。然而,英偉達GPU的高需求導(dǎo)致供應(yīng)緊張和價格上漲,促使科技巨頭探索替代解決方案。相比之下,谷歌TPU在價格和互聯(lián)性方面具有優(yōu)勢。谷歌TPU是為機器學(xué)習(xí)任務(wù)定制設(shè)計的,價格相對更具競爭力,并且提供了更高的芯片級別互聯(lián)性。
與英偉達銷售的獨立芯片相比,谷歌TPU基于谷歌云平臺,蘋果無須在硬件基礎(chǔ)設(shè)施上進行大量投資即可獲得大量計算資源。谷歌TPU是為機器學(xué)習(xí)任務(wù)定制設(shè)計的,自2015年以來一直是谷歌內(nèi)部基礎(chǔ)設(shè)施的一部分,于2017年通過谷歌云公開提供。
相比之下,谷歌TPU也提供了更具有競爭力的價格。據(jù)外媒,在三年預(yù)訂期內(nèi),該產(chǎn)品的最新型號每顆芯片每小時的(訓(xùn)練)成本不到2美元。蘋果的技術(shù)論文表明,TPU架構(gòu)可以開發(fā)更大、更復(fù)雜的AI模型。
寫在最后:
相對于英偉達GPU,谷歌TPU的優(yōu)勢在于芯片級別的互聯(lián)性特別高。因此也有分析認為,這種具有競爭力的定價加上 TPU的架構(gòu)優(yōu)勢,使其成為英偉達GPU的一個替代品。隨著iOS 18.1 Beta版的上線,注冊開發(fā)者可以體驗到蘋果AI的部分功能。不少開發(fā)者在社交媒體上分享了他們的使用體驗,稱蘋果智能在寫作、對話和圖像搜索方面的表現(xiàn)令人印象深刻。
有分析師對科技訊表示,Apple Intelligence能否重新定義行業(yè),關(guān)鍵在于其能否實現(xiàn)真正的個人化智能,整合設(shè)備上的信息和服務(wù),為用戶提供實際參考價值的答案。無論如何,用戶只需耐心等待,觀察各家AI產(chǎn)品的優(yōu)缺點,最終挑選適合自己的AI產(chǎn)品。
原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/670933.html