W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozprawa doktorska

Pobierz BibTeX

Tytuł

Efficient algorithms for extreme multi-label classification

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | [ D ] doktorant

Promotor

[ 1 ] Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | [ P ] pracownik

Recenzenci

Wariant tytułu

PL Efektywne algorytmy dla wieloetykietowej klasyfikacji ekstremalnej

Język

angielski

Słowa kluczowe
EN
  • multilabel classification
  • extreme classification
  • label trees
  • hierarchical softmax
PL
  • klasyfikacja wieloetykietowa
  • klasyfikacja ekstremalna
  • drzewo etykiet
  • hierarchiczny softmax
Streszczenie

EN Extreme multi-label classification is a task of tagging instances with a small subset of labels chosen from a large pool of possible labels. Problems of this scale can be efficiently handled by organizing labels as a tree, like in hierarchical softmax used for multi-class problems. In this dissertation, we propose and investigate probabilistic label trees (PLTs), suitable for estimating the conditional probabilities of labels, that can be treated as a generalization of hierarchical softmax for multi-label problems. We introduce the PLT model and discuss training and inference procedures. We present a general training scheme given a label tree structure in advance and consider a problem of training PLTs in an online setting. We prove the consistency of PLTs for a wide spectrum of performance metrics, analyze the computational complexity of training and prediction procedures, discuss several implementations of PLT, and demonstrate their competitiveness to the state-of-the-art methods.

PL Wieloetykietowa klasyfikacja ekstremalna polega na przypisaniu obserwacji małego zbioru adekwatnych etykiet, będącego pozdbiorem dużego zbioru możliwych etykiet. Problemy tak dużej skali można efektywnie rozwiązać organizując etykiety w drzewo, tak jak w przypadku hierarchicznego softmaksu dla klasyfikacji wieloklasowej. W rozprawie proponujemy i analizujemy klasyfikator probabilistycznych drzew etykiet (PLT), który można traktować jak uogólnienie hierarchicznego softmaksu to problemów wieloetykietowych. Podajemy metody treningu wsadowego i online PLT, dowodzimy zgodności PLT ze względu na wiele miar oceny jakości klasyfikacji, analiujemy jego złożoność obliczeniową, opisujemy kilka implementacji PLT, oraz demonstrujemy ich konkurencyjność w porównaniu do najlepszych metod z dziedziny.

Liczba stron

160

Dyscyplina naukowa (Ustawa 2.0)

informatyka techniczna i telekomunikacja

Sygnatura rozprawy w wersji drukowanej

DrOIN 2147

Katalog on-line

to2022500511

Pełny tekst rozprawy doktorskiej

brak uprawnień do pobrania pliku

Poziom dostępu do pełnego tekstu

archiwum

Pierwsza recenzja

Rohit Babbar

Miejsce

Aalto, Finlandia

Data

06.09.2021

Język

angielski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Druga recenzja

Tomasz Kajdanowicz

Miejsce

Wrocław, Polska

Data

26.11.2021

Język

angielski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Status rozprawy

rozprawa doktorska

Miejsce obrony

Poznań, Polska

Data obrony

21.12.2021

Jednostka nadająca tytuł

Rada Dyscypliny Informatyka Techniczna i Telekomunikacja

Uzyskany tytuł

doktor nauk inżynieryjno-technicznych w dyscyplinie: informatyka techniczna i telekomunikacja

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.