SIN PP | Deep reinforcement learning for motion planning in man-made environments

System Informacji Naukowej Politechniki Poznańskiej

PL EN

Strona główna / Rozprawy doktorskie / Deep reinforcement learning for motion planning in man-made environments

Zgłoś uwagę

Rozprawa doktorska

Pobierz BibTeX

Tytuł

Deep reinforcement learning for motion planning in man-made environments

Autorzy

Piotr Kicki (WARiE) ^{[ 1 ][ P ]}

^{[ 1 ]} Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | ^{[ P ]} pracownik

Promotor

Piotr Skrzypczyński (WARiE) ^{[ 1 ][ P ]}

^{[ 1 ]} Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | ^{[ P ]} pracownik

Promotor pomocniczy

Krzysztof Walas (WARiE) ^{[ 1 ][ P ]}

^{[ 1 ]} Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | ^{[ P ]} pracownik

Recenzenci

Wariant tytułu

PL Głębokie uczenie się ze wzmocnieniem planowania ruchu w środowiskach stworzonych przez człowieka

Język

angielski

Słowa kluczowe

motion planning
robotics
machine learning
reinforcement learning

planowanie ruchu
robotyka
uczenie maszynowe
uczenie ze wzmocnieniem

Streszczenie

EN In this dissertation, we propose advancements in the field of learning-based robot motion planning. We propose a method for rapid path planning for car-like vehicles taking into account geometry of the environment, and non-holonomic and boundary constraints. Moreover, we propose a new method for constrained kinodynamic planning that utilizes a neural network to rapidly plan trajectories that satisfy not only boundary constraints but also kinodynamic ones over the whole trajectory, and minimize some user-defined task loss, thanks to the use of the Lagrangian multipliers-inspired learning procedure. We train our proposed motion planning neural networks using the reinforcement learning paradigm and utilize loss functions that penalize the unwanted behavior of the proposed planners. Finally, we performed an extensive experimental evaluation of the proposed solutions against the state-of-the-art motion planning algorithms and presented their quantitative and qualitative advantages.

PL W niniejszej rozprawie zaproponowano nowe rozwiązania w dziedzinie planowania ruchu robotów w oparciu o uczenie się. Zaproponowano metodę szybkiego planowania ścieżki dla pojazdów o kinematyce samochodu, uwzględniającą geometrię otoczenia oraz ograniczenia nieholonomiczne i brzegowe. Ponadto zaproponowano nową metodę planowania kinodynamicznego z ograniczeniami, która wykorzystuje sieć neuronową do szybkiego planowania trajektorii, które spełniają nie tylko ograniczenia brzegowe, ale także kinodynamiczne i minimalizują funkcję kosztu zdefiniowaną przez użytkownika. Proponowane przez nas sieci neuronowe są uczone planowania ruchu, korzystając z paradygmatu uczenia się ze wzmocnieniem z wykorzystaniem funkcji kosztu, które karzą za generowanie nieodpowiednich planów. Na koniec przeprowadzona została obszerna weryfikacja eksperymentalna proponowanych rozwiązań w odniesieniu do najnowszych algorytmów planowania ruchu pod kątem ilościowym i jakościowym.

Liczba stron

154

Dyscyplina naukowa (Ustawa 2.0)

automatyka, elektronika, elektrotechnika i technologie kosmiczne

Sygnatura rozprawy w wersji drukowanej

DrOIN 2352

Katalog on-line

to2024998937

Pełny tekst rozprawy doktorskiej

Pobierz plik

Poziom dostępu do pełnego tekstu

publiczny

Pierwsza recenzja

Auke Jan Ijspeert

Miejsce

Lausanne, Switzerland

Data

27.02.2024

Język

angielski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Druga recenzja

Ioannis Havoutis

Język

angielski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Trzecia recenzja

Cezary Zieliński

Miejsce

Warszawa, Polska

Data

29.01.2024

Język

polski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Status rozprawy

rozprawa doktorska

Miejsce obrony

Poznań, Polska

Data obrony

04.06.2024

Jednostka nadająca tytuł

Rada Dyscypliny Automatyka, Elektronika, Elektrotechnika i Technologie Kosmiczne Politechniki Poznańskiej

Uzyskany tytuł

doktor nauk inżynieryjno-technicznych w dyscyplinie: automatyka, elektronika, elektrotechnika i technologie kosmiczne

System tworzony przez Politechnikę Poznańską oraz Poznańskie Centrum Superkomputerowo-Sieciowe

Zaloguj się przez eKonto, aby dodać do SIN