谷歌發(fā)布Gemini Live服務(wù),開啟AI語音聊天新紀元

谷歌發(fā)布Gemini Live服務(wù),開啟AI語音聊天新紀元

在今日舉行的Pixel 9系列手機發(fā)布會上,谷歌正式推出了Gemini Live服務(wù),該服務(wù)將首先面向使用英語的Gemini Advanced訂閱用戶開放,為用戶帶來前所未有的自然、流暢的對話交流體驗。

Gemini Live是谷歌在AI語音技術(shù)領(lǐng)域的又一力作,旨在通過增強的語音引擎,實現(xiàn)更加連貫、富有情感表達力和逼真感的多輪對話。這一服務(wù)的推出,無疑是對標了OpenAI ChatGPT最新上線的Advanced Voice模式,進一步推動了AI語音聊天技術(shù)的發(fā)展。

據(jù)谷歌介紹,Gemini Live提供了一種全新的移動對話體驗,讓用戶能夠輕松與Gemini展開自由流暢的對話。用戶不僅可以在聊天過程中打斷Gemini的發(fā)言,提出后續(xù)問題,還能實時適應(yīng)Gemini的說話模式,實現(xiàn)更加自然的交流。此外,Gemini Live還提供了10種新的自然聲音供用戶選擇,讓對話體驗更加個性化。

在發(fā)布會上,谷歌還展示了Gemini Live在模擬面試場景中的應(yīng)用。通過Gemini Live,用戶可以與招聘經(jīng)理(或人工智能)進行對話,獲得演講技巧推薦和優(yōu)化建議。這一功能不僅有助于提升用戶的面試表現(xiàn),還展示了Gemini Live在實際應(yīng)用中的廣泛潛力。

值得注意的是,雖然Gemini Live在語音聊天方面取得了顯著進展,但目前尚不支持多模態(tài)輸入功能。谷歌在今年5月的I/O大會上曾展示過Gemini Live通過手機攝像頭捕捉環(huán)境信息并做出反應(yīng)的能力,但這一功能將推遲到“今年晚些時候”推出。谷歌方面表示,多模態(tài)輸入的加入將進一步豐富Gemini Live的交互方式,為用戶帶來更加全面的智能體驗。

隨著Gemini Live服務(wù)的正式推出,谷歌在AI語音聊天領(lǐng)域的領(lǐng)先地位得到了進一步鞏固。未來,隨著技術(shù)的不斷發(fā)展和完善,我們有理由相信Gemini Live將為用戶帶來更多驚喜和便利。

原創(chuàng)文章,作者:Google,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/673688.html

Google的頭像Google認證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論