Deep reinforcement learning for motion planning in man-made environments
[ 1 ] Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | [ P ] employee
[ 1 ] Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | [ P ] employee
[ 1 ] Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | [ P ] employee
PL Głębokie uczenie się ze wzmocnieniem planowania ruchu w środowiskach stworzonych przez człowieka
english
- motion planning
- robotics
- machine learning
- reinforcement learning
- planowanie ruchu
- robotyka
- uczenie maszynowe
- uczenie ze wzmocnieniem
EN In this dissertation, we propose advancements in the field of learning-based robot motion planning. We propose a method for rapid path planning for car-like vehicles taking into account geometry of the environment, and non-holonomic and boundary constraints. Moreover, we propose a new method for constrained kinodynamic planning that utilizes a neural network to rapidly plan trajectories that satisfy not only boundary constraints but also kinodynamic ones over the whole trajectory, and minimize some user-defined task loss, thanks to the use of the Lagrangian multipliers-inspired learning procedure. We train our proposed motion planning neural networks using the reinforcement learning paradigm and utilize loss functions that penalize the unwanted behavior of the proposed planners. Finally, we performed an extensive experimental evaluation of the proposed solutions against the state-of-the-art motion planning algorithms and presented their quantitative and qualitative advantages.
PL W niniejszej rozprawie zaproponowano nowe rozwiązania w dziedzinie planowania ruchu robotów w oparciu o uczenie się. Zaproponowano metodę szybkiego planowania ścieżki dla pojazdów o kinematyce samochodu, uwzględniającą geometrię otoczenia oraz ograniczenia nieholonomiczne i brzegowe. Ponadto zaproponowano nową metodę planowania kinodynamicznego z ograniczeniami, która wykorzystuje sieć neuronową do szybkiego planowania trajektorii, które spełniają nie tylko ograniczenia brzegowe, ale także kinodynamiczne i minimalizują funkcję kosztu zdefiniowaną przez użytkownika. Proponowane przez nas sieci neuronowe są uczone planowania ruchu, korzystając z paradygmatu uczenia się ze wzmocnieniem z wykorzystaniem funkcji kosztu, które karzą za generowanie nieodpowiednich planów. Na koniec przeprowadzona została obszerna weryfikacja eksperymentalna proponowanych rozwiązań w odniesieniu do najnowszych algorytmów planowania ruchu pod kątem ilościowym i jakościowym.
154
automation, electronics, electrical engineering and space technologies
DrOIN 2352
public
Auke Jan Ijspeert
Lausanne, Switzerland
27.02.2024
english
public
Ioannis Havoutis
english
public
Cezary Zieliński
Warszawa, Polska
29.01.2024
polish
public
dissertation
Poznań, Polska
04.06.2024
Rada Dyscypliny Automatyka, Elektronika, Elektrotechnika i Technologie Kosmiczne Politechniki Poznańskiej
doktor nauk inżynieryjno-technicznych w dyscyplinie: automatyka, elektronika, elektrotechnika i technologie kosmiczne