Block-based and Online Ensembles for Concept-drifting Data Streams
[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee
[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee
PL Blokowe i przyrostowe klasyfikatory złożone dla strumieni danych ze zmienna definicja klas
english
- data streams
- concept drift
- classification
- data mining
- uczenie maszynowe
- klasyfikacja
- strumienie danych
- dryft
EN This thesis investigates classification methods for concept-drifting data streams. We propose the Accuracy Updated Ensemble (AUE) algorithm, which reacts equally well to sudden, gradual, and recurring drifts in block-based data streams. Furthermore, the thesis analyzes three generic strategies for transforming block-based ensemble classifiers into online learners: a) using a sliding window, b) adding a single incremental classifier, c) using a drift detector. Based on this analysis, we propose an online ensemble algorithm called Online Accuracy Updated Ensemble (OAUE), which reacts to several types of changes online. Finally, the thesis reviews existing evaluation methods used to assess stream classifiers and proposes a new measure, called Prequential AUC, which is capable of evaluating classifiers online, on class-imbalanced data streams. All of the proposed algorithms are experimentally compared against competitive classification and evaluation methods.
PL Badania przedstawione w pracy dotyczą klasyfikacji strumieni danych ze zmienną definicja klas. W rozprawie zaproponowano algorytm AUE, który reaguje na nagłe, stopniowe i nawracające zmiany w środowiskach blokowych. Ponadto, przeanalizowano w pracy trzy strategie dostosowujące algorytmy blokowe do środowisk przyrostowych: a) wykorzystanie metody okien przesuwnych, b) dodanie pojedynczego klasyfikatora przyrostowego, c) wykorzystanie detektora dryftu. W oparciu o analizę wymienionych trzech strategii, zaproponowany został algorytm OAUE, który przyrostowo uczy i ocenia klasyfikatory składowe zgodnie z najlepszymi strategiami reakcji na zmiany. W pracy zaproponowano również nową miarę oceny klasyfikatorów, o nazwie Prequential AUC, przystosowaną do przyrostowego przetwarzania strumieni o niezrównoważonych rozkładach klas. Wszystkie zaproponowane algorytmy zostały eksperymentalnie porównane z szeroką gamą istniejących metod uczenia i oceny klasyfikatorów strumieniowych.
171
computer sciences and computer science
computer science
DrOIN 1678
public
Leszek Rutkowski
Częstochowa, Polska
23.04.2015
polish
public
Henryk Rybiński
Warszawa, Polska
15.05.2015
polish
public
dissertation
Poznań, Polska
22.06.2015
Rada Wydziału Informatyki Politechniki Poznańskiej
doktor nauk technicznych w dyscyplinie: informatyka, w specjalności: eksploracja danych