學(xué)習(xí)曲線4:更精進的AI模型與不斷演進的語言

移動AI普及背后的故事——來自三星電子中國研究院的人們與創(chuàng)新

圖片1.jpg

在三星不斷創(chuàng)新,持續(xù)引領(lǐng)卓越移動AI體驗的背景下,我們拜訪了位于世界各地的三星電子研究院,力求探究Galaxy AI是如何助力用戶釋放無限潛能的。如今,Galaxy AI憑借已支持的16種語言,可以服務(wù)更多不同語種的用戶,即便是在離線狀態(tài)下,用戶也能利用基于端側(cè)AI的通話實時翻譯、翻譯助手、筆記助手和瀏覽助手等功能,跨越語言壁壘。那么,關(guān)于Galaxy AI語言翻譯的研發(fā),又有哪些背后的故事呢?上一期,我們拜訪了位于越南的三星電子研究院,了解了用于AI模型訓(xùn)練的數(shù)據(jù)是如何收集的。這一期,我們將走近中國團隊,看他們是如何為中國用戶們提供獨特的Galaxy AI體驗的。

在全球范圍內(nèi),基于大語言模型(LLM)的AI工具正在飛速發(fā)展,中國也不例外。隨著百度 ERNIE Bot 和美圖 Miracle Vision的發(fā)展普及,三星電子中國研究院也選擇了與這兩家公司深入合作,共同打造屬于中國市場的Galaxy AI功能。

攜手不同AI合作伙伴,使得Galaxy AI在后端乃至底層技術(shù)的整合面臨了巨大的挑戰(zhàn),但三星電子中國研究院的北京和廣州團隊必須在規(guī)定的時間內(nèi),讓中國用戶獲得與全球其他用戶相同的 Galaxy AI 體驗。因此,他們利用第三方合作伙伴提供的中國方言專用資源,為中國用戶打造了獨一無二的 Galaxy AI 解決方案。

三星電子廣州研究院軟件創(chuàng)新團隊負(fù)責(zé)人張海榕表示:“我們的優(yōu)勢在于能夠?qū)⑷蜃詈玫膶嵺`經(jīng)驗與中國本土的實踐經(jīng)驗相融合,并通過與中國用戶的日常交流了解用戶的需求,不斷改進提升,開發(fā)新功能。我們的團隊?wèi){借在Galaxy S24項目中積累的豐富開發(fā)經(jīng)驗,與百度、美圖等中國本土人工智能公司攜手合作,帶來了真正贏得用戶共鳴的解決方案,對此我深感自豪?!?/p>

圖片2.jpg

一開始,各團隊都需要適應(yīng)彼此的工作方式,并解決項目初期信息不對等的問題。對此,三星電子中國研究院院長張代君成立了一個特別工作組,以確保項目能夠按照研發(fā)規(guī)劃快速地推進并完成目標(biāo)。

圖片3.jpg

憑借北京團隊在大模型生成方面的豐富經(jīng)驗,以及與第三方合作伙伴的成功合作,所有的生成式AI功能最終在中國成功問世,為中國用戶帶來了更為本土化的具備特定市場功能(如“觸摸搜索”)的解決方案。

基于中文開發(fā)粵語方言模型

早在2024年1月Galaxy S24上市之際,Galaxy AI便已支持了普通話,但對于三星電子中國研究院而言,工作仍未結(jié)束。在此之后,中國團隊投入到了支持粵語的AI模型研發(fā)工作中。該項研究將在普通話語言模型的基礎(chǔ)上,進一步解決粵語語言特征所帶來一系列新問題。

圖片4.jpg

在粵語AI語言模型的開發(fā)過程中,研發(fā)團隊面臨的主要難題就是文化方面的差異。首先,香港的書寫和口語是兩套不同的系統(tǒng)。香港用戶在書寫時使用類似普通話的語法和表達(dá)方式,而在日常交流時則采用完全不同的口語語法。此外,粵語發(fā)音有九個聲調(diào),而普通話則有四個。

另一個文化差異則是粵語方言本身也在與時俱進,并且很多時候人們經(jīng)常會在對話中將粵語和英語混在一起用,因此,創(chuàng)建測試用例、驗證語言包的復(fù)雜程度不言而喻。

圖片5.jpg

“粵語是一種非常獨特的方言,在不同的粵語地區(qū)會有不同的說法,”負(fù)責(zé)粵語AI解決方案測試工作的李靖表示,”一些俚語、短語、詞匯甚至音調(diào)在不同地方都不盡相同。因此,我們對大量香港的詳細(xì)數(shù)據(jù)進行了核對,并校對了數(shù)以萬計的相關(guān)測試案例。”

圖片6.jpg

考慮到這些復(fù)雜性,三星電子中國研究院的北京和廣州團隊合作實現(xiàn)了在粵語和英語的混合語音識別中支持深層代碼混合、在機器翻譯中支持書面和口語表達(dá)、在語音合成中使用當(dāng)前的發(fā)音。

溝通中的文化影響

當(dāng)Galaxy AI的粵語語言包可供使用時,消費者的反饋很好地表明了三星研發(fā)團隊的辛勤工作都是值得的。

三星Galaxy AI的項目經(jīng)驗表明,不管是在中國大陸還是中國香港地區(qū),一個全球品牌不僅應(yīng)擁有專業(yè)的當(dāng)?shù)貓F隊和相關(guān)的當(dāng)?shù)刂R,還要具備與當(dāng)?shù)氐谌胶献骰锇殚_展開放合作的能力。在中國香港地區(qū),粵語是構(gòu)建當(dāng)?shù)鼐用裎幕匦缘闹匾糠帧榇耍?dāng)?shù)貓F隊必須研發(fā)正確的人工智能語言模型。

三星電子中國香港地區(qū)負(fù)責(zé)人Henry Wat表示:“在任何地方、任何行業(yè)中,語言以及溝通交流都非常重要。無論是來自哪里的語言,任何能幫助人們溝通交流的工具都是非常可貴的,我堅信我們的工作很有意義?!?/p>

圖片7.jpg

在下一期《學(xué)習(xí)曲線》中,我們將前往巴西,了解一個團隊如何跨越文化和國界,讓更多人體驗到Galaxy AI。

本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:http://yulan.fabuzhe.com.cn/info/9311/301408.html

陳晨陳晨管理團隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論