Robotický pes se naučí chodit za hodinu

Robotický pes se naučí chodit za hodinu

Novorozená žirafa nebo hříbě se musí naučit chodit po nohách co nejrychleji, aby se vyhnuli predátorům. Zvířata se rodí se svalovými koordinačními sítěmi umístěnými v jejich míše. Naučit se přesné koordinaci svalů a šlach nohou však nějakou dobu trvá. Zpočátku se mláďata zvířat silně spoléhají na pevně zapojené míšní reflexy. Musí se cvičit následující, pokročilejší a přesnější ovládání svalů, dokud se nakonec nervový systém dobře nepřizpůsobí svalům a šlachám nohou mladého zvířete.

Už žádné nekontrolované klopýtání – mladé zvíře nyní může držet krok s dospělými.

Výzkumníci z Institutu Maxe Plancka pro inteligentní systémy (MPI-IS) ve Stuttgartu provedli výzkumnou studii, která měla zjistit, jak se zvířata učí chodit. Postavili čtyřnohého robota velikosti psa, který jim pomohl zjistit detaily.

„Jako inženýři a robotici jsme hledali odpověď tím, že jsme postavili robota, který má reflexy stejně jako zvíře a učí se z chyb,“ říká Felix Ruppert, bývalý doktorand ve výzkumné skupině Dynamic Locomotion na MPI-IS. "Pokud zvíře klopýtá, je to chyba? Ne, když se to stane jednou. Ale pokud klopýtá často, dává nám to měřítko, jak dobře robot chodí."

Felix Ruppert je prvním autorem knihy „ Learning Plastic Matching of Robot Dynamics in Closed-Loop Central Pattern Generators “, která bude publikována v časopise Nature Machine Intelligence .

Učební algoritmus optimalizuje virtuální míchu

Poté, co se Ruppertův robot naučil chodit za pouhou hodinu, dobře využívá svou složitou mechaniku nohou. Učení se řídí Bayesovským optimalizačním algoritmem: naměřené informace senzoru chodidla jsou porovnávány s cílovými daty z modelované virtuální míchy běžící jako program v počítači robota. Robot se učí chodit neustálým porovnáváním odeslaných a očekávaných informací ze senzorů, spouštěním reflexních smyček a přizpůsobováním svých vzorců ovládání motoru.

Učící algoritmus přizpůsobuje řídicí parametry centrálního generátoru vzorů (CPG). U lidí a zvířat jsou tyto centrální generátory vzorů, sítě neuronů v míše, které produkují periodické svalové kontrakce.

Dokud mladé zvíře chodí po dokonale rovném povrchu, mohou CPG stačit k ovládání pohybových signálů z míchy. Malý hrbol na zemi ale změní chůzi. Reflexy nakopnou a upraví pohybové vzorce, aby zvíře nespadlo. Tyto chvilkové změny v pohybových signálech jsou reverzibilní neboli „elastické“ a pohybové vzorce se po narušení vrátí do své původní konfigurace. Pokud však zvíře nepřestane klopýtat v mnoha cyklech pohybu – navzdory aktivním reflexům, musí se pohybové vzorce znovu naučit a učinit je „plastickými“, tj. nevratnými. U novorozeného zvířete nejsou CPG zpočátku ještě dostatečně nastaveny a zvíře klopýtá, jak na rovném, tak i nerovném terénu.

Totéž platí pro robotického psa Mortiho o velikosti labradora. Robot optimalizuje své pohybové vzorce rychleji než zvíře, přibližně za jednu hodinu. Mortiho CPG je simulován na malém a lehkém počítači, který řídí pohyb robotových nohou. Tato virtuální mícha je umístěna na zádech čtyřnohého robota tam, kde by byla hlava. Během hodiny, kterou robot potřebuje k hladké chůzi, jsou data senzorů z chodidel robota průběžně porovnávána s očekávaným dotykem, předpokládaným pomocí CPG robota. Pokud robot klopýtne, algoritmus učení změní, jak daleko se nohy houpou tam a zpět, jak rychle se nohy houpou a jak dlouho je noha na zemi. Upravený pohyb také ovlivňuje, jak dobře může robot využívat svou vyhovující mechaniku nohou. Během procesu učení, CPG vysílá upravené signály, takže robot od nynějška méně klopýtá a optimalizuje svou chůzi. V tomto rámci virtuální mícha nemá žádné explicitní znalosti o konstrukci nohou robota, jeho motorech a pružinách.

„Náš robot se prakticky ‚narodil, aniž by věděl něco anatomii nohou ani o tom, jak fungují,“ vysvětluje Ruppert. "CPG připomíná vestavěnou automatickou inteligenci chůze, kterou poskytuje příroda a kterou jsme přenesli do robota. Počítač produkuje signály, které ovládají motory nohou a robot zpočátku chodí a klopýtá. Data proudí zpět ze senzorů do virtuální míchy, kde se porovnávají data senzoru a CPG. Pokud data senzoru neodpovídají očekávaným datům, algoritmus učení změní chování při chůzi, dokud robot nebude chodit dobře a bez klopýtnutí. Změna výstupu CPG při zachování aktivních reflexů a monitorování klopýtnutí robotů je klíčovou součástí procesu učení."

Energeticky účinné ovládání robotického psa

Mortiho počítač spotřebovává během chůze pouze pět wattů energie. Průmyslové čtyřnohé roboty od předních výrobců, kteří se naučili běžet s pomocí složitých ovladačů, jsou mnohem energeticky náročnější. Jejich ovladače jsou kódovány se znalostí přesné hmotnosti a geometrie těla robota – pomocí modelu robota. Obvykle odebírají několik desítek, až několik set wattů energie. Oba typy robotů běží dynamicky a efektivně, ale spotřeba výpočetní energie je u stuttgartského modelu mnohem nižší. Poskytuje také důležité poznatky o anatomii zvířat.

"Nemůžeme snadno zkoumat míchu živého zvířete. Ale můžeme ji modelovat v robotu," říká Alexander Badri-Spröwitz, který je spoluautorem publikace s Ruppertem a vede výzkumnou skupinu Dynamic Locomotion Research Group. "Víme, že tyto CPG existují u mnoha zvířat. Víme, že reflexy jsou zabudovány; ale jak můžeme obojí zkombinovat, aby se zvířata naučila pohyby s reflexy a CPG? Toto je základní výzkum na průsečíku robotiky a biologie. Robotický model dává odpověď na otázky, na které biologie sama odpovědět nedokáže."

Přiložené soubory:
- Robotický pes se naučí chodit za hodinu