這款新型軟體機(jī)器人借助機(jī)器學(xué)習(xí)算法,擁有像生物一樣柔軟性

前言

在自然界中,有些生物體具有良好的柔軟性和彈性,原因是它們能夠?qū)④浗M織和堅(jiān)硬的骨骼纏繞在一起。而如果將這種靈活性于彈性賦予機(jī)器人,能否解決傳統(tǒng)剛性機(jī)器人的局限性?最近,科學(xué)家們提出了一種易于裝配的基于張拉整體(tensegrity)的軟體機(jī)器人,它具有高度動(dòng)態(tài)的運(yùn)動(dòng)步態(tài),并在面對(duì)物理?yè)p傷的情況下表現(xiàn)出結(jié)構(gòu)和行為的彈性。

生物體將柔軟的(例如,肌肉)和堅(jiān)硬的(如骨骼)材料纏繞在一起,賦予它們?cè)趥鹘y(tǒng)剛性機(jī)器人(rigid robot)中通常缺乏的那種固有的靈活性和彈性。軟體機(jī)器人的新興領(lǐng)域?qū)で罄眠@些相同的特性來創(chuàng)造具有彈性的機(jī)器。然而,軟材料的性質(zhì)給設(shè)計(jì)、建造和控制方面都帶來了相當(dāng)大的挑戰(zhàn)——直到現(xiàn)在,軟體機(jī)器人的絕大多數(shù)步態(tài)都是通過實(shí)驗(yàn)的試錯(cuò)法(trial-and-error)來手動(dòng)設(shè)計(jì)的。本文介紹了一種易于裝配的基于張拉整體(tensegrity)的軟體機(jī)器人,它具有高度動(dòng)態(tài)的運(yùn)動(dòng)步態(tài),并在面對(duì)物理?yè)p傷的情況下表現(xiàn)出結(jié)構(gòu)和行為的彈性。這是通過使用一種機(jī)器學(xué)習(xí)算法而實(shí)現(xiàn)的,該算法能夠用最少的物理試驗(yàn)來發(fā)現(xiàn)有效的步態(tài)。這些結(jié)果進(jìn)一步證實(shí)了軟體機(jī)器人的方法,該方法試圖利用復(fù)雜的材料動(dòng)力學(xué)的相互作用來產(chǎn)生大量的動(dòng)態(tài)行為。

與機(jī)器不同的是,動(dòng)物表現(xiàn)出了極大的彈性,其部分原因是它們將在軟組織和堅(jiān)硬的骨骼纏繞在一起。在自然界中,這種柔軟性引發(fā)了一些利用了軟體系統(tǒng)動(dòng)力學(xué)的令人注目的行為。例如,章魚能夠自適應(yīng)地用“關(guān)節(jié)”塑造他們的四肢,以執(zhí)行有效的抓握。水母利用它們固有的彈性,在游泳時(shí)被動(dòng)地恢復(fù)能量。煙草天蛾毛蟲(Manduca sexta caterpillar)有一種具有類似于“內(nèi)臟運(yùn)動(dòng)活塞(visceral-locomotory piston)”作用的中腸,它在周圍的軟組織之前進(jìn)行前向滑動(dòng),在任何可見的外部變化之前,將它的重心進(jìn)行前向移動(dòng)。

圖1:我們的軟體張拉整體機(jī)器人的概念。(A)第一個(gè)出現(xiàn)于藝術(shù)品中的張拉整體結(jié)構(gòu),與Kenneth Snelson的雕塑一起出現(xiàn)。(B)它們后來被用于建筑,例如Kurilpa橋(澳大利亞布里斯班)。(C)最近,張拉整體被認(rèn)為是活細(xì)胞機(jī)械轉(zhuǎn)導(dǎo)的良好模型。(D)我們的張拉整體機(jī)器人基于碳撐桿和彈簧。它由三個(gè)振動(dòng)器(粘在三個(gè)支柱上)驅(qū)動(dòng),其頻率通過試錯(cuò)學(xué)習(xí)算法(材料和方法)進(jìn)行自動(dòng)調(diào)整。(E)得益于張拉整體結(jié)構(gòu)和彈簧的順從性,我們的機(jī)器人在變形時(shí)會(huì)保持其完整性并彈回初始形式。

從自然世界中獲得靈感,軟體機(jī)器人領(lǐng)域?qū)で笸ㄟ^使用適合、靈活和具有彈性的材料來解決傳統(tǒng)剛性機(jī)器人的一些局限性。例如,Trimmer等人使用形狀記憶合金微線圈驅(qū)動(dòng)(shape memory alloy microcoil actuation)從硅橡膠中構(gòu)建軟體機(jī)器人,它可以以受控制的方式緩慢爬行,或者以不受控制的彈道方式滾動(dòng)。與此類似,Whitesides等人的研究使用了氣動(dòng)充氣(pneumatic inflation)來產(chǎn)生緩慢、動(dòng)態(tài)穩(wěn)定的爬行運(yùn)動(dòng),以及快速、但受控制較少的觸手式抓取器(tentacle-like gripper)、由燃燒驅(qū)動(dòng)的跳線和一個(gè)獨(dú)立的微流體“章魚機(jī)器人(octobot)”。

盡管軟材料機(jī)器人有其優(yōu)點(diǎn),但它們很難通過常規(guī)方法進(jìn)行控制。它們是本質(zhì)上具有無(wú)限的自由度的高維動(dòng)態(tài)系統(tǒng)。提供其吸引力的彈性和可變形性是以共振和組件之間的緊密動(dòng)態(tài)耦合為代價(jià)的,這些性能在傳統(tǒng)機(jī)器人設(shè)計(jì)的工程方法中經(jīng)常被避免,或者至少被抑制。這種復(fù)雜性排除了許多傳統(tǒng)的運(yùn)動(dòng)學(xué)和逆動(dòng)力學(xué)方法對(duì)機(jī)器人所使用的控制。

圖2:所有條件的性能配置文件。

因此,到目前為止,大多數(shù)軟體機(jī)器人的運(yùn)動(dòng)步態(tài)都是通過實(shí)驗(yàn)的試錯(cuò)法來手動(dòng)開發(fā)的。這一過程既具有挑戰(zhàn)性也耗時(shí),尤其是在尋求充分利用軟體機(jī)制的動(dòng)態(tài)復(fù)雜性時(shí)。重要的是,這個(gè)手動(dòng)過程也阻止了這些機(jī)器人在環(huán)境變化時(shí)調(diào)整其控制策略,例如當(dāng)它們遇到意想不到的地形時(shí),或者當(dāng)它們受到物理?yè)p壞時(shí)。

在本研究中,我們介紹了一種基于由振動(dòng)驅(qū)動(dòng)的張拉整體結(jié)構(gòu)的新型軟體機(jī)器人。像許多其他軟體機(jī)器人一樣,這個(gè)張拉整體機(jī)器人具有彈性,并且當(dāng)受到干擾或壓碎時(shí)能夠抵抗損壞。然而,與其他軟體機(jī)器人不同的是,這種特殊的模塊化張拉整體機(jī)器人易于構(gòu)建,易于控制,而且,由于采用了一種數(shù)據(jù)高效的強(qiáng)化學(xué)習(xí)算法,它可以自動(dòng)發(fā)現(xiàn)如何移動(dòng),并在受損時(shí)快速重新學(xué)習(xí)和調(diào)整其行為。

振動(dòng)是一種日益通用的自動(dòng)化系統(tǒng)無(wú)傳感器操縱和控制方法。例如,Rezik等人開發(fā)了一個(gè)由振動(dòng)驅(qū)動(dòng)的平面機(jī)械手,能夠?qū)π〔考M(jìn)行大規(guī)模的分布式平面控制。在移動(dòng)機(jī)器人中,由成對(duì)振動(dòng)電機(jī)驅(qū)動(dòng)的粘滑摩擦運(yùn)動(dòng)(stick-and-slip frictional motion)已經(jīng)被應(yīng)用于各種移動(dòng)機(jī)器人中。通常,這些方法使用實(shí)驗(yàn)得到的手工調(diào)諧頻率(hand-tuned frequency)來生成運(yùn)動(dòng),使用兩種電動(dòng)機(jī)轉(zhuǎn)速的線性插值來平滑地生成一系列行為?;谡駝?dòng)的運(yùn)動(dòng)方法的一個(gè)缺點(diǎn)是,這種類型的振動(dòng)即使在假設(shè)完全一致的表面時(shí)也會(huì)引起不可預(yù)測(cè)的運(yùn)動(dòng),,這對(duì)建模和仿真提出挑戰(zhàn)。

張拉整體是相對(duì)簡(jiǎn)單的機(jī)械系統(tǒng),由許多剛性元件(支柱)組成,通過拉伸元件(電纜或彈簧)連接其端點(diǎn),并通過預(yù)應(yīng)力(prestress forces)的協(xié)同相互作用保持穩(wěn)定(圖1A-C)。除了工程學(xué)之外,張拉整體的性質(zhì)已經(jīng)在自然界的各個(gè)尺度上得以展現(xiàn)出來,從人類手臂的腱網(wǎng)(tendinous network)到活細(xì)胞的力學(xué)轉(zhuǎn)導(dǎo)。在每一種尺寸上,張拉整體結(jié)構(gòu)都表現(xiàn)出兩個(gè)有趣的特征:它們具有令人印象深刻的強(qiáng)度與重量比,且它們?cè)诮Y(jié)構(gòu)上具有魯棒性并能夠在變形的情況下保持穩(wěn)定。此外,與許多其他軟體機(jī)器人(soft robot)不同的是,張拉整體結(jié)構(gòu)本身是模塊化的(僅由支柱和彈簧構(gòu)成),因此相對(duì)容易構(gòu)建。它們非常簡(jiǎn)單,可以作為嬰兒玩具,并以兒童活動(dòng)用書為特色,但足夠復(fù)雜,可作為下一代美國(guó)國(guó)家航空航天局行星漫游車的基礎(chǔ)。

圖3:機(jī)器人損壞的實(shí)驗(yàn)。(A)損壞的機(jī)器人,正如圖1中所展示的那樣一個(gè)彈簧從機(jī)器人身上斷開連接。(B)30次試驗(yàn)后的運(yùn)動(dòng)速度。中心標(biāo)記是中位數(shù),框的邊緣是第25和第75百分位數(shù)(IQR),晶須對(duì)應(yīng)于范圍,晶須(whisker)外的點(diǎn)被認(rèn)為是異常值(這對(duì)應(yīng)于“四分位間規(guī)則”)。每個(gè)條件都使用20次獨(dú)立的算法進(jìn)行測(cè)試。

對(duì)于張拉整體機(jī)器人來說,最常見的控制方法是緩慢地改變支柱和/或纜索的長(zhǎng)度,引起大規(guī)模的準(zhǔn)靜態(tài)(而非動(dòng)態(tài))結(jié)構(gòu)變形,這反過來又使機(jī)器人通過翻滾和滾動(dòng)進(jìn)行移動(dòng)。因?yàn)樗麄冋J(rèn)為這種結(jié)構(gòu)在整個(gè)運(yùn)動(dòng)過程中相對(duì)較硬,所以這種控制策略不適合于更為柔順的軟張拉整體機(jī)器人。另外,它們會(huì)導(dǎo)致運(yùn)動(dòng)速度變慢。

最近,研究人員開始研究關(guān)于張拉整體機(jī)器人控制的更多動(dòng)力學(xué)方法。Bliss等人已經(jīng)使用中心模式生成器(CPG)來產(chǎn)生模擬的非移動(dòng)式張拉整體結(jié)構(gòu)的共振夾帶(resonance entrainment)。Mirletz等人已經(jīng)使用CPG在模擬的基于張拉整體脊柱的機(jī)器人中產(chǎn)生目標(biāo)導(dǎo)向的行為。但是,這些努力無(wú)論多么有價(jià)值,都是在模擬環(huán)境中產(chǎn)生的,并且尚未成功地遷移到真實(shí)世界的機(jī)器人中。正如Mirletz等人所指出的那樣,張拉整體的動(dòng)態(tài)行為高度依賴于它們相互作用的基底——這意味著在模擬環(huán)境中所開發(fā)的結(jié)果不一定可以簡(jiǎn)單地遷移到真正的機(jī)器人上(在進(jìn)化機(jī)器人學(xué)(Evolutionary Robotics)中,這被稱為“現(xiàn)實(shí)差距”)。

最近,B?hm和Zimmermann開發(fā)了一種由單一震動(dòng)電磁鐵驅(qū)動(dòng)的,啟發(fā)于張拉整體的機(jī)器人。雖然這種機(jī)器人不是純粹的張拉整體(它剛性地連接了多個(gè)線性支柱),但它能夠通過改變振蕩器的頻率在前向和反向移動(dòng)之間進(jìn)行切換。另外,科學(xué)家門已經(jīng)提出將振動(dòng)作為一種控制更為柔軟的機(jī)器人的手段。

圖4:張拉整體機(jī)器人的無(wú)限制版本。

在本文中,我們探索了一個(gè)假設(shè),即現(xiàn)實(shí)世界的軟張拉整體機(jī)器人的固有共振和動(dòng)態(tài)復(fù)雜性可以被有效地加以利用(而不是被抑制),并且,如果得到適當(dāng)?shù)募?lì),它就可以產(chǎn)生共鳴,從而使機(jī)器人執(zhí)行階梯狀(step-like)圖案,從而使其能夠運(yùn)動(dòng)。為了驗(yàn)證這一假設(shè),并證明軟張拉整體機(jī)器人的潛力,我們?cè)O(shè)計(jì)了一個(gè)口袋大小的軟張拉整體機(jī)器人,該機(jī)器人的參數(shù)被調(diào)整為最大限度的共振,其目標(biāo)是在平坦地形上盡可能快地進(jìn)行移動(dòng)。為了找到合適的振動(dòng)頻率,我們?yōu)闄C(jī)器人配備了數(shù)據(jù)有效的反復(fù)試驗(yàn)算法,該算法還使得它能夠在需要時(shí)進(jìn)行調(diào)整。

軟張拉整體機(jī)器人具有很高的復(fù)原性,易于用現(xiàn)有技術(shù)進(jìn)行組裝,并且可使用廉價(jià)材料進(jìn)行制造。總之,振動(dòng)式軟張拉整體機(jī)器人將軟體機(jī)器人技術(shù)的大部分復(fù)雜性(構(gòu)建和驅(qū)動(dòng)軟結(jié)構(gòu))重新塑造成一類更為簡(jiǎn)單的機(jī)器人(易于構(gòu)建和驅(qū)動(dòng)),同時(shí)保持軟體機(jī)器人的許多具有吸引力的特征,例如,彈性和可變形性。得益于學(xué)習(xí)算法,我們的原型可以實(shí)現(xiàn)大于10 cm / s的運(yùn)動(dòng)速度(每秒大于一個(gè)身體長(zhǎng)度),并在小于30次試驗(yàn)中學(xué)習(xí)新的步法,從而使其可以適應(yīng)損傷或新情況。據(jù)我們所知,這使其成為最快的軟體機(jī)器人之一。我們的軟張拉整體機(jī)器人實(shí)現(xiàn)了這種速度,因?yàn)樗鼈儶?dú)特地利用了張拉整體結(jié)構(gòu)的靈活性和共振性。以這種方式發(fā)現(xiàn)利用靈活性和共振的方法,為未來的張拉整體結(jié)構(gòu)開辟了新的研究途徑,特別是當(dāng)機(jī)械設(shè)計(jì)可以與自動(dòng)識(shí)別如何控制共振的機(jī)器學(xué)習(xí)算法結(jié)合時(shí),更是如此。

總體而言,得益于促動(dòng)器(振動(dòng)器)、結(jié)構(gòu)(彈簧和支柱)以及環(huán)境(地面)之間的復(fù)雜相互作用,我們的柔張拉整體機(jī)器人得以移動(dòng)。這種緊急行為在所體現(xiàn)的智能理論中占據(jù)核心位置,這表明如果我們鼓勵(lì)身體與“精神”之間的這種深度耦合——此處指控制器,我們將獲得更好更為逼真的機(jī)器人。然而,正如本文所展示的那樣,試錯(cuò)法學(xué)習(xí)算法為發(fā)現(xiàn)這些緊急行為提供了一種強(qiáng)有力的可行方法。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容