Depending on the amount of data to process, file generation may take longer.

If it takes too long to generate, you can limit the data by, for example, reducing the range of years.

Dissertation

Download BibTeX

Title

Block-based and Online Ensembles for Concept-drifting Data Streams

Authors

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee

Promoter

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee

Reviewers

Title variant

PL Blokowe i przyrostowe klasyfikatory złożone dla strumieni danych ze zmienna definicja klas

Language

english

Keywords
EN
  • data streams
  • concept drift
  • classification
  • data mining
PL
  • uczenie maszynowe
  • klasyfikacja
  • strumienie danych
  • dryft
Abstract

EN This thesis investigates classification methods for concept-drifting data streams. We propose the Accuracy Updated Ensemble (AUE) algorithm, which reacts equally well to sudden, gradual, and recurring drifts in block-based data streams. Furthermore, the thesis analyzes three generic strategies for transforming block-based ensemble classifiers into online learners: a) using a sliding window, b) adding a single incremental classifier, c) using a drift detector. Based on this analysis, we propose an online ensemble algorithm called Online Accuracy Updated Ensemble (OAUE), which reacts to several types of changes online. Finally, the thesis reviews existing evaluation methods used to assess stream classifiers and proposes a new measure, called Prequential AUC, which is capable of evaluating classifiers online, on class-imbalanced data streams. All of the proposed algorithms are experimentally compared against competitive classification and evaluation methods.

PL Badania przedstawione w pracy dotyczą klasyfikacji strumieni danych ze zmienną definicja klas. W rozprawie zaproponowano algorytm AUE, który reaguje na nagłe, stopniowe i nawracające zmiany w środowiskach blokowych. Ponadto, przeanalizowano w pracy trzy strategie dostosowujące algorytmy blokowe do środowisk przyrostowych: a) wykorzystanie metody okien przesuwnych, b) dodanie pojedynczego klasyfikatora przyrostowego, c) wykorzystanie detektora dryftu. W oparciu o analizę wymienionych trzech strategii, zaproponowany został algorytm OAUE, który przyrostowo uczy i ocenia klasyfikatory składowe zgodnie z najlepszymi strategiami reakcji na zmiany. W pracy zaproponowano również nową miarę oceny klasyfikatorów, o nazwie Prequential AUC, przystosowaną do przyrostowego przetwarzania strumieni o niezrównoważonych rozkładach klas. Wszystkie zaproponowane algorytmy zostały eksperymentalnie porównane z szeroką gamą istniejących metod uczenia i oceny klasyfikatorów strumieniowych.

Number of pages

171

OECD domain

computer sciences and computer science

KBN discipline

computer science

Signature of printed version

DrOIN 1678

On-line catalog

to201480848

Full text of dissertation

Download file

Access level to full text

public

First review

Leszek Rutkowski

Place

Częstochowa, Polska

Date

23.04.2015

Language

polish

Review text

Download file

Access level to review text

public

Second review

Henryk Rybiński

Place

Warszawa, Polska

Date

15.05.2015

Language

polish

Review text

Download file

Access level to review text

public

Dissertation status

dissertation

Place of defense

Poznań, Polska

Date of defense

22.06.2015

Unit granting title

Rada Wydziału Informatyki Politechniki Poznańskiej

Obtained title

doktor nauk technicznych w dyscyplinie: informatyka, w specjalności: eksploracja danych

This website uses cookies to remember the authenticated session of the user. For more information, read about Cookies and Privacy Policy.