Przyrostowe uczenie reguł oraz wykorzystanie detekcji zmian w blokowych klasyfikatorach złożonych do przetwarzania danych strumieniowych
[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee
[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee
EN Incremental rule learning and usage of change detection in block-based ensembles of classifiers for data streams
polish
- strumienie danych
- uczenie nadzorowane
- klasyfikator złożony
- detektor zmian
- reguły decyzyjne
- data streams
- supervised learning
- ensemble of classifiers
- drift detection
- rule learning
PL Rozprawa przedstawia nowe algorytmy uczenia klasyfikatorów dostosowujących się do zmian w strumieniach danych. Jako pierwszy zaproponowano blokowy klasyfikator złożony Batch Weighted Ensemble (BWE). Integruje on metodę detekcji zmian Batch Drift Detection Method (BDDM) z klasyfikatorem złożonym. Innowacyjność BDDM dotyczy: przetwarzania bloków danych oraz estymacji trendu trafności klasyfikacji za pomocą regresji. Ocena eksperymentalna pokazała, że BWE obniża koszty obliczeniowe. Następnie, BWE uogólniono do Online Batch Weighted Ensemble (OBWE), który przetwarzane dane przyrostowo. Pozwala to na szybszą reakcję na zmiany, co znacząco wpłynęło na poprawę trafności klasyfikacji. Dodatkowo zaproponowano algorytm przyrostowej indukcji reguł decyzyjnych RILL. Jego innowacyjność polega na: podwójnej reprezentacji wiedzy, adaptacji do zmian za pomocą okna przesuwnego oraz intensywnym przycinaniu reguł. W ocenie eksperymentalnej RILL był najlepszy spośród porównywanych klasyfikatorów regułowych. Uczył się szybko, a także szybko powracał do poprawnego działania po zajściu zmian.
EN One of challenges for classifiers mining data streams is to properly react to concept drifts. This thesis proposes new algorithms that deal with this problem. First, a new block-based multiple classifier called Batch Weighted Ensemble (BWE) is presented. It incorporates the new Batch Drift Detection Method (BDDM) into the structure of the ensemble. The novelty of BDDM includes: working on blocks and estimating accuracy trends with regression. Experimental evaluation of BWE showed that it achieved the lowest computational costs among compared methods. To improve accuracy, BWE was generalized to Online Batch Weighted Ensemble (OBWE). It incrementally processes learning examples and allows faster reaction to changes. Experimental evaluation of OBWE showed that it has significantly improved the value of the total accuracy. Additionally, a new rule-based incremental learner called RILL was proposed. Its novelty refers to: two-fold knowledge representation, adapting to changes with sliding window and intensive pruning. In experimental evaluation RILL outperformed two related rule classifiers. It learned quite fast and quickly recovered after change occurred.
142
computer sciences and computer science
computer science
DrOIN 1714
public
Dominik Ślęzak
Warszawa, Polska
15.05.2015
polish
public
Michał Woźniak
Wrocław, Polska
12.02.2015
polish
public
dissertation
Poznań, Polska
24.11.2015
Rada Wydziału Informatyki Politechniki Poznańskiej
doktor nauk technicznych w dyscyplinie: informatyka, w specjalności: uczenie maszynowe