W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

Empowering On-Device Training: Leveraging Inference Accelerators for Enhanced Training Efficiency

Autorzy

[ 1 ] Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | [ 2 ] Instytut Robotyki i Inteligencji Maszynowej, Wydział Automatyki, Robotyki i Elektrotechniki, Politechnika Poznańska | [ SzD ] doktorant ze Szkoły Doktorskiej | [ P ] pracownik

Dyscyplina naukowa (Ustawa 2.0)

[2.2] Automatyka, elektronika, elektrotechnika i technologie kosmiczne

Rok publikacji

2024

Typ rozdziału

abstrakt

Język publikacji

angielski

Słowa kluczowe
EN
  • on-device training
  • hardware acceleration
  • AI accelerator
  • continual learning
Streszczenie

EN On-device training is essential in practical continual learning (CL) applications. However, the current methods predominantly focus on memory optimization, while computing power and time budget are primary concerns for most real-world systems. Thus, this study leverages a high-performance AI co-processor primarily developed to enhance the inference of deep learning algorithms to accelerate the on-device training. In conducted examinations, layers' parameters of various levels of model architecture were frozen, transferred, and processed on an AI chip. While the model adaptive stage, with a backpropagation algorithm, was computed on the CPU. The proposed approach achieved up to 17$\times$ training time acceleration compared to a CPU-only process without performance degradation. Concerning conducted examinations, the research findings highlight the potential of advanced hardware accelerators in addressing the computational challenges of on-device CL, paving the way for more efficient and practical deployment in resource-constrained settings.

Strony (od-do)

211 - 214

Książka

20th International Summer School on Advanced Computer Architecture and Compilation for High-performance Embedded Systems, ACACES 2024 : Poster Abstracts

Zaprezentowany na

20th International Summer School on Advanced Computer Architecture and Compilation for High-performance Embedded Systems (ACACES 2024), 17.07.2024, Fiuggi, Italy

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.