Anthropic 推出升級版 Claude 3.5 Sonnet 模型,可操控用戶電腦

Anthropic 推出了升級版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型,升級版 Claude 3.5 Sonnet 不僅編程能力更強,還帶來全新功能 computer use(計算機使用),支持像人類一樣操作計算機,可以遵循用戶的命令在計算機屏幕上移動光標,點擊相關(guān)位置,并通過虛擬鍵盤輸入信息,模擬人們與自己計算機的交互方式。

10 月 23 日消息,當?shù)貢r間 10 月 22 日,Anthropic 推出了升級版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型,升級版 Claude 3.5 Sonnet 不僅編程能力更強,還帶來全新功能 computer use(計算機使用),支持像人類一樣操作計算機,可以遵循用戶的命令在計算機屏幕上移動光標,點擊相關(guān)位置,并通過虛擬鍵盤輸入信息,模擬人們與自己計算機的交互方式。

Anthropic 推出升級版 Claude 3.5 Sonnet 模型,可操控用戶電腦

升級版 Claude 3.5 Sonnet 現(xiàn)已可以使用,computer use 測試版也已開放使用。

進化后的 Claude 3.5 Sonnet 在各個方面得到了全面顯著的提升,尤其是業(yè)界領(lǐng)先的編碼能力。

Anthropic 首席科學官 Jared Kaplan 表示:“我認為我們將進入一個新時代,模型可以像人一樣使用所有的工具來完成任務(wù)?!?/p>

升級版 Claude 3.5 Sonnet 的發(fā)布標志著 Anthropic 在商業(yè) AI 模型領(lǐng)域的一項重要進展。該模型旨在超越傳統(tǒng)的聊天框,成為真正的“AI 代理”。

所謂的“AI 代理”是指能夠像人類一樣使用軟件并執(zhí)行其他計算機任務(wù)的 AI 模型。有些 AI 代理,如 Cognition AI 的 Devin,專門用于編程。而 Anthropic 則將其 AI 代理定位為一個多面手,聲稱它可以瀏覽網(wǎng)頁并使用任何網(wǎng)站或應(yīng)用程序。用戶可以根據(jù)自己的需求來使用 AI 代理,無論是編程等技術(shù)任務(wù),還是旅行規(guī)劃等簡單任務(wù)。

在 Wired 描述的一個演示中,Claude 被要求規(guī)劃一次與朋友一起在日出時觀看金門大橋的旅行。AI 打開了一個網(wǎng)頁瀏覽器,在谷歌上搜索了一個好的觀景點和其他細節(jié),并將行程添加到日歷應(yīng)用程序中。雖然令人印象深刻,但 Wired 指出,Claude 沒有考慮到其他有用的細節(jié),比如如何到達那里。

在另一個演示中,Claude 被要求創(chuàng)建一個簡單的網(wǎng)站,它使用微軟的 Visual Studio Code 來完成這項任務(wù),甚至打開了一個本地服務(wù)器來測試它剛剛創(chuàng)建的網(wǎng)站。雖然在創(chuàng)建過程中出現(xiàn)了一個小錯誤,但當給予提示后,其糾正了代碼。

然而,盡管這些 AI 模型看起來很有前景,但它們?nèi)匀淮嬖诳煽啃缘膯栴},尤其是在編寫代碼方面,Anthropic 的模型也不例外。據(jù) TechCrunch 報道,即使在簡單的測試中,如預訂航班和修改預訂,Claude 3.5 Sonnet 也只成功完成了不到一半的任務(wù)。

除了技術(shù)上的不完善,AI 代理還帶來了明顯的安全風險。用戶是否愿意讓這些不穩(wěn)定且有時難以預測的技術(shù)訪問個人電腦文件并使用網(wǎng)絡(luò)瀏覽器,仍是一個值得深思的問題。

Anthropic 對此表示,通過逐步開放這種有限、相對更安全的 AI 模型,能夠幫助提升 AI 代理的安全性。他們在聲明中寫道:“我們認為,與其等到更強大的模型出現(xiàn),不如讓現(xiàn)有較為安全的模型接觸電腦,這樣我們可以開始觀察并應(yīng)對潛在問題,在提升使用水平的同時逐步增強安全措施?!?/p>

原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/687910.html

科技探索者的頭像科技探索者管理團隊

相關(guān)推薦

發(fā)表回復

登錄后才能評論