Google Gemini 1.5 Pro推出公共預(yù)覽版它可以聽(tīng)到聲音

AI ? 2024年4月10日 15:02:12 ? AI

在最近的Google Next活動(dòng)中，谷歌宣布了對(duì)其人工智能模型Gemini 1.5 Pro的重大更新，這一更新為模型帶來(lái)了前所未有的聽(tīng)覺(jué)能力。Gemini 1.5 Pro現(xiàn)在能夠處理和理解上傳的音頻文件，這意味著它可以直接從財(cái)報(bào)電話會(huì)議或視頻音頻中提取信息，而無(wú)需依賴書(shū)面文字記錄。

此次更新的亮點(diǎn)是，Gemini 1.5 Pro在性能上已經(jīng)超越了Gemini家族中最大最強(qiáng)的機(jī)型Gemini Ultra。谷歌聲稱，Gemini 1.5 Pro能夠理解復(fù)雜的指令，而無(wú)需對(duì)模型進(jìn)行微調(diào)，這標(biāo)志著AI技術(shù)的一個(gè)重要進(jìn)步。

然而，值得注意的是，Gemini 1.5 Pro的使用受限于能夠訪問(wèn)Vertex AI和AI Studio的用戶。目前，大多數(shù)人通過(guò)Gemini聊天機(jī)器人接觸到Gemini語(yǔ)言模型，而Gemini Ultra則為Gemini Advanced聊天機(jī)器人提供動(dòng)力。盡管Gemini Ultra功能強(qiáng)大，但在速度上不及Gemini 1.5 Pro。

除了Gemini 1.5 Pro，谷歌的另一大型AI模型Imagen 2也獲得了更新。Imagen 2是一種文本到圖像生成模型，它不僅增強(qiáng)了Gemini的圖像生成能力，還新增了圖像編輯功能，允許用戶在圖像中添加或刪除元素。此外，谷歌還為通過(guò)Imagen模型創(chuàng)建的所有圖片提供了SynthID數(shù)字水印功能，該功能在圖像上添加了一個(gè)對(duì)觀看者不可見(jiàn)的水印，以標(biāo)記圖像的來(lái)源。

谷歌還公開(kāi)預(yù)覽了一種新方法，將其人工智能響應(yīng)與谷歌搜索結(jié)合起來(lái)，以便用最新的信息進(jìn)行回答。這一舉措意味著，即使是大型語(yǔ)言模型也能提供最新的信息，而不僅僅是基于內(nèi)部數(shù)據(jù)的回答。值得一提的是，谷歌有意不讓Gemini回答與2024年美國(guó)大選相關(guān)的問(wèn)題，這表明了對(duì)信息敏感性的考量。

Gemini因生成與歷史人物不準(zhǔn)確的照片而受到批評(píng)，這一事件提醒我們，盡管人工智能技術(shù)取得了巨大進(jìn)步，但仍需謹(jǐn)慎處理與歷史和現(xiàn)實(shí)世界相關(guān)的數(shù)據(jù)。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請(qǐng)注明出處：http://2079x.cn/article/645533.html

AI認(rèn)證作者

0 0

新聞

?微軟發(fā)布Win11 Dev 26200.5600預(yù)覽版更新：智能文本功能“Click to Do”上線

昨日晚間，微軟給開(kāi)發(fā)者用戶派發(fā)了一份“智能大禮包”——Windows 11 Dev頻道用戶現(xiàn)在可以升級(jí)到Build 26200.5600預(yù)覽版，其中最搶眼的功能是?“點(diǎn)一下就能讓文…

Microsoft
14小時(shí)前
商業(yè)

?臺(tái)積電4月銷售額同比飆升48%，創(chuàng)近三年新高

全球半導(dǎo)體代工龍頭臺(tái)積電今日公布2025年4月運(yùn)營(yíng)數(shù)據(jù)：當(dāng)月銷售額達(dá)3495.67億新臺(tái)幣（約合837億元人民幣），較去年同期激增48.1%，環(huán)比增長(zhǎng)22.2%。這一單月增幅創(chuàng)下近…

若安丶
4天前
商業(yè)

?馬斯克旗下xAI新一輪融資或?qū)_刺1200億美元估值逼近OpenAI

據(jù)知情人士今日透露，特斯拉CEO埃隆·馬斯克創(chuàng)立的AI公司xAI正啟動(dòng)新一輪融資談判，潛在xAI估值或達(dá)1200億美元（約合8687億元人民幣），成為全球估值第二高的人工智能企業(yè)，…

商業(yè)頭條
4天前
AI

蘋(píng)果聯(lián)手Anthropic打造AI編碼神器 Xcode新版整合Claude模型

蘋(píng)果公司正與人工智能新銳Anthropic深度合作，開(kāi)發(fā)名為「氛圍編碼」（vibe-coding）的AI輔助編程平臺(tái)。該平臺(tái)將作為Xcode開(kāi)發(fā)環(huán)境的新版本，集成Anthropic…

AI
5天前
AI

OpenAI啟動(dòng)”星際之門(mén)”全球擴(kuò)張：5000億美元AI數(shù)據(jù)中心劍指法德英

據(jù)?英國(guó)金融時(shí)報(bào)披露，OpenAI正加速推進(jìn)其估值5000億美元的”星際之門(mén)”（Stargate）人工智能數(shù)據(jù)中心項(xiàng)目全球化布局。該公司全球事務(wù)副總裁Chr…

AI
5天前
商業(yè)

OpenAI豪擲30億美元收購(gòu)編程巨頭Windsurf AI代碼助手賽道風(fēng)云再起

據(jù)彭博社最新報(bào)道，人工智能領(lǐng)軍企業(yè)OpenAI已就收購(gòu)AI編程助手開(kāi)發(fā)商Windsurf（注冊(cè)名Exafunction Inc.）達(dá)成初步協(xié)議，交易估值高達(dá)30億美元（約合217.…

商業(yè)頭條
2025年5月6日
新聞

美國(guó)兩黨聯(lián)手立法：擬強(qiáng)制英偉達(dá)AI芯片植入“定位追蹤”防走私

美國(guó)民主黨眾議員比爾·福斯特（Bill Foster）計(jì)劃未來(lái)數(shù)周提交法案，要求對(duì)英偉達(dá)等公司的人工智能芯片實(shí)施“定位追蹤”及運(yùn)行限制，以遏制走私至中國(guó)等被管制國(guó)家的行為。這一提案…

小科同學(xué)
2025年5月6日
AI

?谷歌Gemini AI將推Ultra訂閱版！視頻生成限制或解除

近日，據(jù)外媒報(bào)道稱，谷歌計(jì)劃擴(kuò)展其人工智能服務(wù)Gemini AI的訂閱體系，或新增“Gemini Ultra”高級(jí)層級(jí)。此舉或進(jìn)一步強(qiáng)化其在生成式AI領(lǐng)域的商業(yè)化布局。目前，谷歌…

Google
2025年5月2日
新聞

馬斯克官宣Grok 3.5下周上線首個(gè)能解答火箭難題的AI要來(lái)了

當(dāng)?shù)貢r(shí)間4月29日，特斯拉及SpaceX創(chuàng)始人埃隆·馬斯克通過(guò)社交平臺(tái)宣布，旗下人工智能產(chǎn)品Grok 3.5的早期測(cè)試版將于下周正式向“SuperGrok”訂閱用戶開(kāi)放。他稱，Gr…

AI
2025年4月30日
新聞

昆侖萬(wàn)維豪賭AI致巨虧16億，投資者買(mǎi)單？

4月25日，昆侖萬(wàn)維（300418.SZ）交出一份令市場(chǎng)嘩然的成績(jī)單：2024年?營(yíng)業(yè)總收入56.6億元，同比增長(zhǎng)15.2%?，但歸母凈利潤(rùn)卻巨虧?15.95億元?，同比暴跌226…

聆聽(tīng)
2025年4月28日
新聞

英偉達(dá)GTC大會(huì)首度登陸臺(tái)北國(guó)際電腦展，AI技術(shù)盛宴即將開(kāi)幕

英偉達(dá)官網(wǎng)最新信息顯示，其年度技術(shù)盛會(huì)?GTC Taipei 2025?將于5月21日至22日在臺(tái)北漢來(lái)大飯店舉行，同期配套的實(shí)作坊活動(dòng)則從5月20日持續(xù)至22日。這是英偉達(dá)首次將…

野游栗
2025年4月28日
AI

OpenAI開(kāi)放免費(fèi)體驗(yàn)！Deep Research輕量版AI搜索功能上線

人工智能公司OpenAI近日宣布，面向全體用戶推出輕量版Deep Research AI搜索功能。新功能基于o4-mini模型開(kāi)發(fā)，免費(fèi)用戶每月可獲得5次使用機(jī)會(huì)，付費(fèi)用戶將根據(jù)訂…

AI
2025年4月27日
新聞

AI智能體公司完成7500萬(wàn)美元融資，估值四個(gè)月暴漲四倍

彭博社報(bào)道稱，中國(guó)通用型AI智能體開(kāi)發(fā)商蝴蝶效應(yīng)（Butterfly Effect）近期完成7500萬(wàn)美元（約合5.47億元人民幣）融資，由美國(guó)頂級(jí)風(fēng)投Benchmark領(lǐng)投，現(xiàn)有…

商業(yè)頭條
2025年4月25日
新聞

?蘋(píng)果管理層再調(diào)整：AI負(fù)責(zé)人卸任機(jī)器人項(xiàng)目，兩大硬件團(tuán)隊(duì)合并

據(jù)彭博社報(bào)道，蘋(píng)果公司宣布新一輪管理層架構(gòu)調(diào)整，人工智能與機(jī)器學(xué)習(xí)高級(jí)副總裁約翰·賈南德雷亞（John Giannandrea）不再負(fù)責(zé)秘密機(jī)器人項(xiàng)目，其管理職責(zé)將轉(zhuǎn)交硬件工程高級(jí)…

Apple
2025年4月25日
新聞

?傳媒巨頭Ziff Davis起訴OpenAI：指控非法抓取數(shù)百萬(wàn)文章訓(xùn)練AI

據(jù)外媒報(bào)道稱，美國(guó)數(shù)字媒體集團(tuán)Ziff Davis正式向紐約聯(lián)邦法院提起訴訟，指控人工智能公司OpenAI在未經(jīng)授權(quán)的情況下，“系統(tǒng)性復(fù)制”其旗下包括CNET、PCMag等45個(gè)媒…

小丸子
2025年4月25日
新聞

英偉達(dá)高管:AI數(shù)據(jù)中心建設(shè)熱度未減

當(dāng)?shù)貢r(shí)間4月24日，在美國(guó)哈姆能源研究院主辦的行業(yè)峰會(huì)上，英偉達(dá)、亞馬遜及AI初創(chuàng)公司高管集體發(fā)聲，強(qiáng)調(diào)全球人工智能數(shù)據(jù)中心建設(shè)仍保持高速推進(jìn)。英偉達(dá)高管:AI數(shù)據(jù)中心建設(shè)熱度未減…

李森
2025年4月25日
出海

沃爾瑪發(fā)布AI工具，顛覆服裝業(yè)

沃爾瑪正式宣布其自主研發(fā)的生成式AI工具“Trend-to-Product”全面應(yīng)用于服裝開(kāi)發(fā)，該工具通過(guò)分析社交媒體、電商平臺(tái)等渠道的實(shí)時(shí)數(shù)據(jù)，將傳統(tǒng)服裝開(kāi)發(fā)周期從18周縮短至6…

AI
2025年4月25日
新聞

?微軟Microsoft 365 Copilot免費(fèi)用戶5月將迎重大更新：導(dǎo)航界面全面改版

據(jù)外媒披露，微軟計(jì)劃自5月中旬起向所有Microsoft 365 Copilot Chat用戶（無(wú)需付費(fèi)訂閱許可證）推送“Wave 2春季更新”。此次升級(jí)重點(diǎn)優(yōu)化導(dǎo)航與交互邏輯，旨…

Microsoft
2025年4月24日
AI

?Gemini用戶半年激增3倍谷歌AI月活破3.5億緊追ChatGPT

根據(jù)谷歌反壟斷訴訟中最新披露的內(nèi)部數(shù)據(jù)，其人工智能聊天機(jī)器人Gemini全球月活躍用戶數(shù)（MAU）在今年3月達(dá)到3.5億，較六個(gè)月前增長(zhǎng)近3倍。這是谷歌首次公開(kāi)該產(chǎn)品的用戶增長(zhǎng)軌跡…

Google
2025年4月24日
AI

OpenAI計(jì)劃開(kāi)源首款A(yù)I模型推理性能對(duì)標(biāo)Meta、谷歌

近日，OpenAI正式確認(rèn)將推出自2019年GPT-2以來(lái)的首個(gè)開(kāi)源語(yǔ)言模型。據(jù)知情人士透露，該模型由研究副總裁Aidan Clark主導(dǎo)開(kāi)發(fā)，計(jì)劃于今年夏季初發(fā)布，其核心目標(biāo)是在…

AI
2025年4月24日