Algoritmy pro zvýšení bezpečnosti robotů, pracujících v přeplněných prostředích

Algoritmy pro zvýšení bezpečnosti robotů, pracujících v přeplněných prostředích

Lidé jsou vrozeně schopni přizpůsobit své chování a jednání pohybům jiných lidí v jejich okolí. Lidští řidiči mohou například náhle zastavit, zpomalit, řídit nebo nastartovat auto na základě jednání ostatních řidičů, chodců nebo cyklistů, protože vědí, že některé manévry jsou ve specifických situacích riskantní.

Vývoj robotů a autonomních vozidel, které mohou podobně předvídat lidské pohyby a hodnotit riziko provádění různých akcí v dané situaci, se však zatím ukázal jako velmi náročný. To mělo za následek řadu nehod, včetně tragické smrti chodce, kterého v březnu 2018 zasáhlo samohybné vozidlo Uber.

Vědci ze Stanfordské univerzity a Toyota Research Institute (TRI) nedávno vyvinuli algoritmus, který by těmto nehodám mohl v budoucnu zabránit a zvýšit bezpečnost autonomních vozidel a dalších robotických systémů pracujících v přeplněném prostředí. Tento algoritmus, představený v příspěvku předem publikovaném na serveru arXiv, kombinuje dva nástroje, algoritmus strojového učení a techniku ​​k dosažení kontroly citlivé na riziko.

„Hlavním cílem naší práce je umožnit bezpečně fungovat samojízdná auta a další roboty mezi lidmi (tj. lidskými řidiči, chodci, cyklisty atd.), A to s ohledem na to, co tito lidé hodlají v budoucnu dělat, řekli Haruki Nishimura a Boris Ivanovic.

Nishimura, Ivanovic a jejich kolegové vyvinuli model strojového učení a trénovali jej tak, aby předpovídali budoucí činy lidí v okolí robota. Pomocí tohoto modelu poté vytvořili algoritmus, který dokáže odhadnout riziko kolize spojené s každým z potenciálních manévrů robota v daném čase. Tento algoritmus může automaticky zvolit optimální manévr pro robota, který by měl minimalizovat riziko kolize s jinými lidmi nebo auty a zároveň umožnit robotovi pohybovat se směrem k dokončení své mise nebo cíle.

„Stávající metody umožňující autonomním autům a jiným robotům navigovat mezi lidmi, obecně trpí dvěma důležitými zjednodušeními“ uvedli vědci. „Zaprvé vytvářejí zjednodušující předpoklady o tom, co budou lidé v budoucnu dělat; zadruhé, nezvažují kompromis mezi rizikem kolize a pokrokem robota. Naproti tomu naše metoda využívá bohatý, stochastický model lidského pohybu. To se učí z údajů o skutečném lidském pohybu. “

 

„Zvažujeme úplné rozdělení možných budoucích lidských pohybů,“ vysvětlili Nishimura a Ivanovic. „Poté zvolíme další akci našeho robota, abychom dosáhli jak nízkého rizika kolizí (tj. robot se srazí s žádným nebo jen s velmi malým množstvím předvídaných pohybů lidí), zatímco stále budeme řídit robota ve směru, kterým se chce pohybovat. Toto se nazývá optimální řízení citlivé na riziko a v zásadě nám umožňuje určit další akci robota v reálném čase. Výpočet, který vyžaduje, se odehrává za zlomek sekundy a průběžně se opakuje, když se robot pohybuje ve svém prostředí.“

K vyhodnocení jejich rámce provedli Nishimura, Ivanovic a jejich kolegové simulační studii i experiment v reálném světě. V simulační studii porovnali výkon svého algoritmu s výkonem tří běžně používaných algoritmů pro předcházení kolizím v úkolu, kde robot musel určit nejlepší akce pro bezpečnou navigaci v prostředích obsahujících až 50 pohybujících se lidí. V experimentu z reálného světa naopak použili svůj algoritmus k vedení akcí řízeného robota s názvem Ouijabot ve vnitřním prostředí, které bylo osídleno pěti pohybujícími se lidskými subjekty.

Výsledky obou těchto testů byly velmi slibné, přičemž algoritmus vědců vypočítal optimální trajektorie, které minimalizovaly riziko kolize robota s lidmi v jeho okolí. Je pozoruhodné, že algoritmus také překonal všechny algoritmy pro předcházení kolizím, s nimiž byl srovnáván.

„Naším hlavním cílem je zajistit bezpečnější autonomní auta a další roboty pro člověka,“ uvedli vědci. „Abychom zajistili bezpečný provoz robotů kolem lidí, musíme je naučit předvídat lidský pohyb na základě zkušeností a poskytnout jim citlivost na riziko, aby se vyhnuli rizikovému chování, které může vést ke kolizím. To je přesně to, co náš algoritmus dělá.“

V budoucnu by tento navigační algoritmus mohl zvýšit bezpečnost robotů a vozidel s vlastním řízením, což by jim umožnilo předvídat akce lidí nebo vozidel v jejich okolí a pohotově reagovat na tyto akce, aby se zabránilo kolizím. Předtím, než bude možné jej implementovat ve velkém měřítku, bude potřeba rámec otestovat na velkých databázích obsahujících videa lidí pohybujících se v přeplněných prostředích podobných prostředí, ve kterém budou roboti fungovat. Aby se tento tréninkový proces zjednodušil, Nishimura, Ivanovic a jejich kolegové plánují vyvinout metodu, která umožní robotům shromažďovat tato tréninková data online, když jsou v provozu.

„Chtěli bychom také, aby roboti dokázali identifikovat model, který odpovídá specifickému chování lidí v jeho bezprostředním prostředí,“ uvedli Nishimura a Ivanovic. „Bylo by například velmi užitečné, kdyby robot mohl v daném okamžiku kategorizovat nevyzpytatelného řidiče nebo opilého řidiče a vyhnout se přílišnému přiblížení k řidiči, aby se snížilo riziko kolize. Lidští řidiči to dělají přirozeně, ale je velmi obtížné to kodifikovat pomocí algoritmu, který robot může použít.“