Depending on the amount of data to process, file generation may take longer.

If it takes too long to generate, you can limit the data by, for example, reducing the range of years.

Dissertation

Download BibTeX

Title

Przyrostowe uczenie reguł oraz wykorzystanie detekcji zmian w blokowych klasyfikatorach złożonych do przetwarzania danych strumieniowych

Authors

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee

Promoter

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee

Reviewers

Title variant

EN Incremental rule learning and usage of change detection in block-based ensembles of classifiers for data streams

Language

polish

Keywords
PL
  • strumienie danych
  • uczenie nadzorowane
  • klasyfikator złożony
  • detektor zmian
  • reguły decyzyjne
EN
  • data streams
  • supervised learning
  • ensemble of classifiers
  • drift detection
  • rule learning
Abstract

PL Rozprawa przedstawia nowe algorytmy uczenia klasyfikatorów dostosowujących się do zmian w strumieniach danych. Jako pierwszy zaproponowano blokowy klasyfikator złożony Batch Weighted Ensemble (BWE). Integruje on metodę detekcji zmian Batch Drift Detection Method (BDDM) z klasyfikatorem złożonym. Innowacyjność BDDM dotyczy: przetwarzania bloków danych oraz estymacji trendu trafności klasyfikacji za pomocą regresji. Ocena eksperymentalna pokazała, że BWE obniża koszty obliczeniowe. Następnie, BWE uogólniono do Online Batch Weighted Ensemble (OBWE), który przetwarzane dane przyrostowo. Pozwala to na szybszą reakcję na zmiany, co znacząco wpłynęło na poprawę trafności klasyfikacji. Dodatkowo zaproponowano algorytm przyrostowej indukcji reguł decyzyjnych RILL. Jego innowacyjność polega na: podwójnej reprezentacji wiedzy, adaptacji do zmian za pomocą okna przesuwnego oraz intensywnym przycinaniu reguł. W ocenie eksperymentalnej RILL był najlepszy spośród porównywanych klasyfikatorów regułowych. Uczył się szybko, a także szybko powracał do poprawnego działania po zajściu zmian.

EN One of challenges for classifiers mining data streams is to properly react to concept drifts. This thesis proposes new algorithms that deal with this problem. First, a new block-based multiple classifier called Batch Weighted Ensemble (BWE) is presented. It incorporates the new Batch Drift Detection Method (BDDM) into the structure of the ensemble. The novelty of BDDM includes: working on blocks and estimating accuracy trends with regression. Experimental evaluation of BWE showed that it achieved the lowest computational costs among compared methods. To improve accuracy, BWE was generalized to Online Batch Weighted Ensemble (OBWE). It incrementally processes learning examples and allows faster reaction to changes. Experimental evaluation of OBWE showed that it has significantly improved the value of the total accuracy. Additionally, a new rule-based incremental learner called RILL was proposed. Its novelty refers to: two-fold knowledge representation, adapting to changes with sliding window and intensive pruning. In experimental evaluation RILL outperformed two related rule classifiers. It learned quite fast and quickly recovered after change occurred.

Number of pages

142

OECD domain

computer sciences and computer science

KBN discipline

computer science

Signature of printed version

DrOIN 1714

On-line catalog

to201680910

Full text of dissertation

Download file

Access level to full text

public

First review

Dominik Ślęzak

Place

Warszawa, Polska

Date

15.05.2015

Language

polish

Review text

Download file

Access level to review text

public

Second review

Michał Woźniak

Place

Wrocław, Polska

Date

12.02.2015

Language

polish

Review text

Download file

Access level to review text

public

Dissertation status

dissertation

Place of defense

Poznań, Polska

Date of defense

24.11.2015

Unit granting title

Rada Wydziału Informatyki Politechniki Poznańskiej

Obtained title

doktor nauk technicznych w dyscyplinie: informatyka, w specjalności: uczenie maszynowe

This website uses cookies to remember the authenticated session of the user. For more information, read about Cookies and Privacy Policy.