SIS PUT | Deep reinforcement learning for motion planning in man-made environments

Scientific Information System of the Poznań University of Technology

PL EN

Main page / Dissertations / Deep reinforcement learning for motion planning in man-made environments

Submit a comment

Dissertation

Download BibTeX

Title

Deep reinforcement learning for motion planning in man-made environments

Authors

Piotr Kicki (WARiE) ^{[ 1 ][ P ]}

^{[ 1 ]} Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | ^{[ P ]} employee

Promoter

Piotr Skrzypczyński (WARiE) ^{[ 1 ][ P ]}

^{[ 1 ]} Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | ^{[ P ]} employee

Supporting promoter

Krzysztof Walas (WARiE) ^{[ 1 ][ P ]}

^{[ 1 ]} Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | ^{[ P ]} employee

Reviewers

Title variant

PL Głębokie uczenie się ze wzmocnieniem planowania ruchu w środowiskach stworzonych przez człowieka

Language

english

Keywords

motion planning
robotics
machine learning
reinforcement learning

planowanie ruchu
robotyka
uczenie maszynowe
uczenie ze wzmocnieniem

Abstract

EN In this dissertation, we propose advancements in the field of learning-based robot motion planning. We propose a method for rapid path planning for car-like vehicles taking into account geometry of the environment, and non-holonomic and boundary constraints. Moreover, we propose a new method for constrained kinodynamic planning that utilizes a neural network to rapidly plan trajectories that satisfy not only boundary constraints but also kinodynamic ones over the whole trajectory, and minimize some user-defined task loss, thanks to the use of the Lagrangian multipliers-inspired learning procedure. We train our proposed motion planning neural networks using the reinforcement learning paradigm and utilize loss functions that penalize the unwanted behavior of the proposed planners. Finally, we performed an extensive experimental evaluation of the proposed solutions against the state-of-the-art motion planning algorithms and presented their quantitative and qualitative advantages.

PL W niniejszej rozprawie zaproponowano nowe rozwiązania w dziedzinie planowania ruchu robotów w oparciu o uczenie się. Zaproponowano metodę szybkiego planowania ścieżki dla pojazdów o kinematyce samochodu, uwzględniającą geometrię otoczenia oraz ograniczenia nieholonomiczne i brzegowe. Ponadto zaproponowano nową metodę planowania kinodynamicznego z ograniczeniami, która wykorzystuje sieć neuronową do szybkiego planowania trajektorii, które spełniają nie tylko ograniczenia brzegowe, ale także kinodynamiczne i minimalizują funkcję kosztu zdefiniowaną przez użytkownika. Proponowane przez nas sieci neuronowe są uczone planowania ruchu, korzystając z paradygmatu uczenia się ze wzmocnieniem z wykorzystaniem funkcji kosztu, które karzą za generowanie nieodpowiednich planów. Na koniec przeprowadzona została obszerna weryfikacja eksperymentalna proponowanych rozwiązań w odniesieniu do najnowszych algorytmów planowania ruchu pod kątem ilościowym i jakościowym.

Number of pages

154

Scientific discipline (Law 2.0)

automation, electronics, electrical engineering and space technologies

Signature of printed version

DrOIN 2352

On-line catalog

to2024998937

Full text of dissertation

Download file

Access level to full text

public

First review

Auke Jan Ijspeert

Place

Lausanne, Switzerland

Date

27.02.2024

Language

english

Review text

Download file

Access level to review text

public

Second review

Ioannis Havoutis

Language

english

Review text

Download file

Access level to review text

public

Third review

Cezary Zieliński

Place

Warszawa, Polska

Date

29.01.2024

Language

polish

Review text

Download file

Access level to review text

public

Dissertation status

dissertation

Place of defense

Poznań, Polska

Date of defense

04.06.2024

Unit granting title

Rada Dyscypliny Automatyka, Elektronika, Elektrotechnika i Technologie Kosmiczne Politechniki Poznańskiej

Obtained title

doktor nauk inżynieryjno-technicznych w dyscyplinie: automatyka, elektronika, elektrotechnika i technologie kosmiczne

System created by Poznań University of Technology and Poznan Supercomputing and Networking Center