對(duì)人類來說看似簡(jiǎn)單的事情有無限多的變量,簡(jiǎn)單任務(wù)的復(fù)雜性,我們認(rèn)為理所當(dāng)然。但機(jī)器人沒有這樣的奢望。
這正是為什么大部分行業(yè)都專注于在結(jié)構(gòu)化環(huán)境中重復(fù)任務(wù)。值得慶幸的是,近年來機(jī)器人學(xué)習(xí)領(lǐng)埴出現(xiàn)了一些改變游戲規(guī)則的突破,行業(yè)正在走上創(chuàng)建和部署更多適應(yīng)性系統(tǒng)的軌道。
去年,谷歌DeepMind的機(jī)器人團(tuán)隊(duì)展示了Robotics Transformer – RT-1 – 它訓(xùn)練其Everyday Robot系統(tǒng)執(zhí)行諸如拾放和打開抽屜等任務(wù)。該系統(tǒng)基于130,000個(gè)演示的數(shù)據(jù)庫(kù),根據(jù)團(tuán)隊(duì)的說法,其成功率為“超過700”項(xiàng)任務(wù)的97%。
今天它正在揭開RT-2的面紗。在一篇博客文章中,DeepMind的杰出科學(xué)家兼機(jī)器人負(fù)責(zé)人Vincent Vanhoucke表示,該系統(tǒng)允許機(jī)器人有效地將相對(duì)較小數(shù)據(jù)集上學(xué)到的概念轉(zhuǎn)移到不同場(chǎng)景。
“RT-2顯示出改進(jìn)的泛化能力和超出其接觸到的機(jī)器人數(shù)據(jù)的語義和視覺理解能力”,谷歌解釋道?!斑@包括解釋新命令并通過執(zhí)行基礎(chǔ)推理來響應(yīng)用戶命令,例如推理關(guān)于對(duì)象類別或高級(jí)描述。”該系統(tǒng)有效地展示了根據(jù)現(xiàn)有上下文信息確定諸如特定新任務(wù)最佳工具之類事物的能力。
Vanhoucke引用了一個(gè)場(chǎng)景,在其中要求機(jī)器人扔掉垃圾。在許多模型中,用戶必須教機(jī)器人識(shí)別什么符合垃圾標(biāo)準(zhǔn),然后訓(xùn)練它撿起垃圾并扔掉。這是一個(gè)細(xì)節(jié)水平,對(duì)于預(yù)期執(zhí)行一系列不同任務(wù)的系統(tǒng)來說并不特別可擴(kuò)展。
“由于RT-2能夠從大量網(wǎng)絡(luò)數(shù)據(jù)中轉(zhuǎn)移知識(shí),它已經(jīng)對(duì)垃圾有了一個(gè)概念,并且可以在沒有明確訓(xùn)練的情況下識(shí)別它”,Vanhoucke寫道。“它甚至有一個(gè)如何扔掉垃圾的想法,盡管它從未接受過采取這種行動(dòng)的培訓(xùn)。并且想想垃圾的抽象性質(zhì)——吃完后薯片袋或香蕉皮就變成了垃圾。RT-2能夠從其視覺語言培訓(xùn)數(shù)據(jù)中理解這一點(diǎn)并完成工作。”
團(tuán)隊(duì)表示,在從RT-1到RT-2跳躍時(shí)執(zhí)行新任務(wù)的效率率已從32%提高到62%。
原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/574134.html
我們機(jī)器人家族越來越強(qiáng)大了,感謝人類造物主