在今日舉行的Pixel 9系列手機(jī)發(fā)布會(huì)上,谷歌正式推出了Gemini Live服務(wù),該服務(wù)將首先面向使用英語的Gemini Advanced訂閱用戶開放,為用戶帶來前所未有的自然、流暢的對話交流體驗(yàn)。
Gemini Live是谷歌在AI語音技術(shù)領(lǐng)域的又一力作,旨在通過增強(qiáng)的語音引擎,實(shí)現(xiàn)更加連貫、富有情感表達(dá)力和逼真感的多輪對話。這一服務(wù)的推出,無疑是對標(biāo)了OpenAI ChatGPT最新上線的Advanced Voice模式,進(jìn)一步推動(dòng)了AI語音聊天技術(shù)的發(fā)展。
據(jù)谷歌介紹,Gemini Live提供了一種全新的移動(dòng)對話體驗(yàn),讓用戶能夠輕松與Gemini展開自由流暢的對話。用戶不僅可以在聊天過程中打斷Gemini的發(fā)言,提出后續(xù)問題,還能實(shí)時(shí)適應(yīng)Gemini的說話模式,實(shí)現(xiàn)更加自然的交流。此外,Gemini Live還提供了10種新的自然聲音供用戶選擇,讓對話體驗(yàn)更加個(gè)性化。
在發(fā)布會(huì)上,谷歌還展示了Gemini Live在模擬面試場景中的應(yīng)用。通過Gemini Live,用戶可以與招聘經(jīng)理(或人工智能)進(jìn)行對話,獲得演講技巧推薦和優(yōu)化建議。這一功能不僅有助于提升用戶的面試表現(xiàn),還展示了Gemini Live在實(shí)際應(yīng)用中的廣泛潛力。
值得注意的是,雖然Gemini Live在語音聊天方面取得了顯著進(jìn)展,但目前尚不支持多模態(tài)輸入功能。谷歌在今年5月的I/O大會(huì)上曾展示過Gemini Live通過手機(jī)攝像頭捕捉環(huán)境信息并做出反應(yīng)的能力,但這一功能將推遲到“今年晚些時(shí)候”推出。谷歌方面表示,多模態(tài)輸入的加入將進(jìn)一步豐富Gemini Live的交互方式,為用戶帶來更加全面的智能體驗(yàn)。
隨著Gemini Live服務(wù)的正式推出,谷歌在AI語音聊天領(lǐng)域的領(lǐng)先地位得到了進(jìn)一步鞏固。未來,隨著技術(shù)的不斷發(fā)展和完善,我們有理由相信Gemini Live將為用戶帶來更多驚喜和便利。
原創(chuàng)文章,作者:Google,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/673688.html