OpenAI正式發(fā)布GPT-4 變身無所不能的人工智能

強大的識圖能力;文字輸入限制提升至2 5萬字;回答準確性顯著提高;能夠生成歌詞、創(chuàng)意文本,實現(xiàn)風(fēng)格變化

3月15日,人工智能公司OpenAI正式發(fā)布了多模態(tài)模型GPT-4。相比之前的產(chǎn)品,官方稱,GPT-4實現(xiàn)了以下幾個方面的飛躍式提升:強大的識圖能力;文字輸入限制提升至2.5萬字;回答準確性顯著提高;能夠生成歌詞、創(chuàng)意文本,實現(xiàn)風(fēng)格變化。

總體來說,GPT-4在文本和圖像方面的“多模態(tài)”訓(xùn)練將使它能夠擺脫聊天框,更充分地模擬一個擁有色彩和圖像的世界,在其“高級推理能力”方面超過ChatGPT。一個人可以上傳一張圖片,而GPT-4可以為其添加標題,描述物體和場景。

識別圖像 做到看圖說話

OpenAI的總裁和聯(lián)合創(chuàng)始人Greg Brockman,就親自在YouTube上進行了一把直播,來實時演示Live Demo中,展示了GPT-4的真正實力,GPT-3.5做不到的, GPT-4輕松拿下。

GPT-4的識圖能力也很強,當看到一張懸掛在木制蹺蹺板上的拳擊手套的照片時,一個人可以問如果手套掉下來會發(fā)生什么,GPT-4會回答說它會撞擊蹺蹺板并導(dǎo)致球飛起來。

當給出一張冰箱里放滿蔬菜的圖片后,在下面提問,用上面的蔬菜能制作什么晚餐的時候,GPT-4會回答說,可以制作沙拉等。隨后還詳細列出來制作的步驟。

在提供的案例中,同樣可以看出GPT-4可以同時解析文本和圖像,這也使它能夠解釋更復(fù)雜的信息。不過,目前圖像輸入的權(quán)限尚未公開,所以目前還沒看到更多例子來證明GPT-4在圖像方面的處理能力。

隨后舉行的Live Demo中,OpenAI也表示,還沒有公開提供這部分技術(shù),但已經(jīng)在和一家名為Be My Eyes的公司進行合作,對方會使用GPT-4來構(gòu)建服務(wù)。

拆分變身 做到無所不能

Greg Brockman在視頻中展示了GPT-4的新的使用界面,左側(cè)是系統(tǒng)框,可以規(guī)定AI的角色,以及整體的回答原則,中間則是對話框,可以輸入具體的對話形態(tài)來對具體的內(nèi)容進行調(diào)整、追問或者給出反饋。最右側(cè)是一些參數(shù)設(shè)置。

在演示中,Brockman就使用使用左側(cè)的“系統(tǒng)”框,讓GPT-4相繼成為“ChatGPT”、“AI編程助手”、“TaxGPT”,來解決不同的問題。ChatGPT模式下,GPT-4可以處理超過2.5萬字的文本,可以輕松地總結(jié)一篇超長文章的核心內(nèi)容,比如把OpenAI今天發(fā)布的這篇講述GPT-4的雄文總結(jié)要點。

在演示中,在“AI編程助手”模式下,還可以讓它輕松寫代碼,生成一個網(wǎng)站,或者更復(fù)雜的,寫一個基于Discord的機器人,如果出現(xiàn)錯誤,比如要調(diào)用比較新的API而出錯,甚至也不需要向它解釋,而是把錯誤代碼復(fù)制進去,它就會自動糾錯,生成新的代碼。

除此之外,GPT-4還能做到總結(jié)文章、寫代碼、報稅、寫詩……可以說是無所不能。

能力變強 學(xué)習(xí)能力再精進

雖然GPT-4對于許多現(xiàn)實場景的處理比人類差,但它在各種體現(xiàn)專業(yè)和學(xué)術(shù)能力的 benchmark 上,已表現(xiàn)出和人類相當?shù)乃健?/p>

GPT-4在其他語言上的能力,OpenAI使用 Azure Translate,將一套涵蓋57個主題的1.4萬多項選擇題的MMLU基準,翻譯成了多種語言,然后進行測試。

在測試的26種語言中,有24種語言,GPT-4優(yōu)于 GPT-3.5和其他大語言模型的英語語言性能。其中中文達到了80.1%的準確性,而GPT-3.5的英文的準確性為70.1%,也就是說,在這個測試中,GPT-4對于中文的語言理解,已經(jīng)優(yōu)于此前ChatGPT對于英文的理解。

官方公布的數(shù)據(jù)顯示,GPT-4通過了模擬律師考試,其分數(shù)在應(yīng)試者的前 10% 左右;相比之下,GPT-3.5的得分卻在倒數(shù) 10% 左右。OpenAI表示,他們花了6個月的時間來使用對抗性測試程序,以及通過 ChatGPT 的經(jīng)驗教訓(xùn)迭代調(diào)整GPT-4,從而在真實性和可控性等方面取得了有史以來最好的結(jié)果。

寫在最后:

隨著ChatGPT已經(jīng)發(fā)展到基本上“適用于所有語言”,該技術(shù)和應(yīng)用已經(jīng)挑戰(zhàn)產(chǎn)業(yè)對于AI的認知,但行業(yè)的迅速發(fā)展,正如預(yù)測的那樣,這些人工智能語言模型的廣泛可用性帶來了問題和挑戰(zhàn)。

在宣布GPT-4時,OpenAI強調(diào)該系統(tǒng)已經(jīng)過六個月的安全培訓(xùn),在內(nèi)部測試中,“響應(yīng)不允許內(nèi)容請求的可能性降低了82%,產(chǎn)生事實響應(yīng)的可能性比GPT-40.3高出5%。但是,這并不意味著系統(tǒng)不會犯錯誤或輸出有害內(nèi)容。GPT-4也仍然缺乏對2021年9月“絕大部分數(shù)據(jù)切斷后發(fā)生的事件”的了解。

原創(chuàng)文章,作者:蘋果派,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/570137.html

蘋果派的頭像蘋果派管理團隊

相關(guān)推薦