streszczenie: Naukowcy wykorzystali uczenie się przez głębokie wzmacnianie (DRL), aby umożliwić robotowi adaptacyjną zmianę chodu, naśladując ruchy zwierząt, takie jak kłus i galop, w celu skutecznego pokonywania złożonego terenu. W ich badaniu zbadano koncepcję przeżywalności – czyli zapobiegania upadkom – jako głównego czynnika wpływającego na takie zmiany chodu, podważając wcześniejsze przekonania, że głównym czynnikiem wpływającym na efektywność energetyczną jest efektywność energetyczna.
To nowe podejście nie tylko zwiększa zdolność robota do radzenia sobie w trudnym terenie, ale także zapewnia głębszy wgląd w ruch zwierząt. Odkrycia zespołu sugerują, że nadanie priorytetu zapobieganiu upadkom może prowadzić do bardziej elastycznego i wydajnego ruchu robotycznego i biologicznego po nierównych powierzchniach.
Kluczowe fakty:
- Dostosowanie chodu do przetrwania: Robot EPFL DRL został wykorzystany do nauki przejść podczas chodzenia, przede wszystkim ze względu na ciągłość, skutecznie dostosowując swoje strategie ruchu, aby uniknąć upadku podczas poruszania się po terenie z przerwami.
- Ponowna ocena efektywności energetycznej: Wbrew wcześniejszym teoriom badanie wykazało, że poprawa efektywności energetycznej jest raczej konsekwencją niż czynnikiem wpływającym na przemieszczanie się pieszo w trudnych warunkach.
- Zwinność robota inspirowana biologią: W badaniu zaprezentowano architekturę uczenia się inspirowaną biologią, która umożliwia spontaniczne zmiany chodu oparte na uczeniu się, wykazując zaawansowaną zwinność robota w poruszaniu się po kolejnych lukach w terenie doświadczalnym.
źródło: EPFL
Za pomocą uczenia maszynowego zwanego głębokim uczeniem się przez wzmacnianie (DRL) robot EPFL w szczególności nauczył się przechodzić z kłusa do stępa – chodu podskakiwanego w oparciu o łuk, używanego przez zwierzęta takie jak springbok i jeleń – do poruszania się w trudnym terenie z odstępami 14-30 cm.
Badanie przeprowadzone przez Laboratorium BioRobotics na Wydziale Inżynierii EPFL dostarcza nowych informacji na temat tego, dlaczego i w jaki sposób zachodzą takie zmiany chodu u zwierząt.
„Poprzednie badania wykazały, że głównymi wyjaśnieniami zmian chodu są efektywność energetyczna i unikanie urazów układu mięśniowo-szkieletowego. Niedawno biolodzy stwierdzili, że ważniejsza może być stabilność na płaskim terenie”.
„Jednak eksperymenty na zwierzętach i robotach pokazały, że hipotezy te nie zawsze są słuszne, zwłaszcza na nierównym terenie” – mówi doktorant Milad Shafii, pierwsza autorka artykułu opublikowanego w czasopiśmie Komunikacja przyrodnicza.
Chaveille, współautorzy Guillaume Bellegarda i szef laboratorium BioRobotics Auke Eijsbert byli zainteresowani nową hipotezą wyjaśniającą, dlaczego zachodzą zmiany chodu: zdolnością do utrzymania się na nogach lub uniknięcia upadków. Aby przetestować tę hipotezę, wykorzystali DRL do wytrenowania czworonożnego robota w pokonywaniu różnych terenów.
Na płaskim terenie odkryli, że różne chody wykazywały różny poziom siły w obliczu przypadkowych pchnięć oraz że robot przełączał się z chodu na kłus, aby zachować przeżywalność, tak jak robią to czworonożne zwierzęta podczas przyspieszania.
Kiedy robot napotykał kolejne szczeliny na powierzchni doświadczalnej, automatycznie przełączał się z kłusu na bieg, aby uniknąć upadku. Co więcej, jedynym czynnikiem poprawiającym się dzięki takim zmianom chodu była przeżywalność.
„Pokazaliśmy, że na płaskim i trudnym, dyskretnym terenie przeżywalność powoduje zmianę chodu, ale efektywność energetyczna niekoniecznie się poprawia” – wyjaśnia Shafii.
„Wygląda na to, że efektywność energetyczna, wcześniej uważana za siłę napędową takich przemian, może mieć raczej skutek, gdy zwierzę porusza się w trudnym terenie, jego priorytet prawdopodobnie nie spadnie, a w następnej kolejności zajmie się efektywnością energetyczną”.
Architektura edukacyjna inspirowana biologią
Aby zamodelować kontrolę ruchu w swoim robocie, naukowcy wzięli pod uwagę trzy współdziałające elementy, które napędzają ruch zwierzęcia: mózg, rdzeń kręgowy i sensoryczne informacje zwrotne z organizmu.
Wykorzystali DRL do wyszkolenia sieci neuronowej tak, aby naśladowała transmisję sygnałów mózgowych z rdzenia kręgowego do ciała, gdy robot przekraczał teren doświadczalny. Następnie zespół przypisał różne wagi trzem potencjalnym celom nauczania: efektywności energetycznej, redukcji siły i przeżywalności.
Seria symulacji komputerowych wykazała, że spośród tych trzech celów przeżywalność była jedynym celem, który skłonił robota do automatycznej zmiany chodu – bez instrukcji ze strony naukowców.
Zespół podkreśla, że obserwacje te stanowią pierwsze oparte na uczeniu ramy lokomocji, w których przejścia chodu pojawiają się automatycznie w procesie uczenia się, a także najbardziej dynamiczne pokonywanie tak dużych kolejnych odstępów dla czworonożnego robota.
„Nasza inspirowana życiem architektura uczenia się zademonstrowała najnowocześniejszą mobilność quadkoptera w trudnym terenie” – mówi Shafi.
Naukowcy zamierzają poszerzyć swoją pracę o dodatkowe eksperymenty, w których różne typy robotów będą umieszczane w szerokiej gamie trudnych środowisk.
Mają nadzieję, że oprócz dalszego wyjaśnienia sposobu poruszania się zwierząt ich praca ostatecznie umożliwi szerzej rozpowszechnione zastosowanie robotyki w badaniach biologicznych, zmniejszając zależność od modeli zwierzęcych i związane z nimi obawy etyczne.
O aktualnościach z zakresu robotyki i badań nad sztuczną inteligencją
autor: Celii Lauterbacher
źródło: EPFL
Komunikacja: Celia Lauterbacher – EPFL
zdjęcie: Zdjęcie pochodzi od BioRob EPFL
Oryginalne wyszukiwanie: Otwarty dostęp.
„Przeżywalność prowadzi do zmian chodu w nauce zwinnego czworonożnego poruszania się w trudnym terenie„Przez Milad Shafie i in. Komunikacja przyrodnicza
podsumowanie
Przeżywalność prowadzi do zmian chodu w nauce zwinnego czworonożnego poruszania się w trudnym terenie
Zwierzęta czworonożne potrafią płynnie przechodzić między różnymi chodami. Chociaż efektywność energetyczna wydaje się być jedną z przyczyn zmiany chodu, inne czynniki prawdopodobnie również odgrywają rolę, w tym charakterystyka terenu.
W tym artykule proponujemy, aby przeżywalność, tj. unikanie upadków, stanowi ważne kryterium zmiany chodu.
Badamy pojawienie się transformacji chodu poprzez interakcję między silnikiem nadrdzeniowym (mózgiem), centralnym generatorem wzorców w rdzeniu kręgowym, ciałem i odczuwaniem zewnętrznym, wykorzystując głębokie uczenie się przez wzmacnianie i narzędzia robotyki.
Zgodnie z danymi dotyczącymi czworonogów pokazujemy, że przenoszenie chodu kłusem przez czworonożne roboty na płaskim terenie poprawia zarówno witalność, jak i efektywność energetyczną.
Ponadto badamy wpływ odrębnego terenu (tj. przekraczania kolejnych luk) na wymuszanie zmian chodu i stwierdzamy pojawienie się przejść kłusakiem, aby uniknąć nieopłacalnych sytuacji.
Przeżywalność jest jedynym czynnikiem poprawiającym się po przejściach pieszych zarówno po płaskim, jak i dyskretnym terenie z przerwami, co sugeruje, że przeżywalność może być głównym i uniwersalnym celem przejść pieszych, podczas gdy inne kryteria są celami drugorzędnymi i/lub konsekwencją zdolności do pozostania.
Co więcej, nasze eksperymenty pokazują zwinność najnowocześniejszego czworonożnego robota w trudnych scenariuszach.
More Stories
Jak czarne dziury stały się tak duże i szybkie? Odpowiedź kryje się w ciemności
Według skamieniałości prehistoryczna krowa morska została zjedzona przez krokodyla i rekina
Wystrzelenie rakiety Falcon 9 firmy SpaceX zostało wstrzymane ze względu na zbliżanie się dwóch głównych misji załogowych lotów kosmicznych