W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozprawa doktorska

Pobierz BibTeX

Tytuł

Przyrostowe uczenie reguł oraz wykorzystanie detekcji zmian w blokowych klasyfikatorach złożonych do przetwarzania danych strumieniowych

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik

Promotor

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik

Recenzenci

Wariant tytułu

EN Incremental rule learning and usage of change detection in block-based ensembles of classifiers for data streams

Język

polski

Słowa kluczowe
PL
  • strumienie danych
  • uczenie nadzorowane
  • klasyfikator złożony
  • detektor zmian
  • reguły decyzyjne
EN
  • data streams
  • supervised learning
  • ensemble of classifiers
  • drift detection
  • rule learning
Streszczenie

PL Rozprawa przedstawia nowe algorytmy uczenia klasyfikatorów dostosowujących się do zmian w strumieniach danych. Jako pierwszy zaproponowano blokowy klasyfikator złożony Batch Weighted Ensemble (BWE). Integruje on metodę detekcji zmian Batch Drift Detection Method (BDDM) z klasyfikatorem złożonym. Innowacyjność BDDM dotyczy: przetwarzania bloków danych oraz estymacji trendu trafności klasyfikacji za pomocą regresji. Ocena eksperymentalna pokazała, że BWE obniża koszty obliczeniowe. Następnie, BWE uogólniono do Online Batch Weighted Ensemble (OBWE), który przetwarzane dane przyrostowo. Pozwala to na szybszą reakcję na zmiany, co znacząco wpłynęło na poprawę trafności klasyfikacji. Dodatkowo zaproponowano algorytm przyrostowej indukcji reguł decyzyjnych RILL. Jego innowacyjność polega na: podwójnej reprezentacji wiedzy, adaptacji do zmian za pomocą okna przesuwnego oraz intensywnym przycinaniu reguł. W ocenie eksperymentalnej RILL był najlepszy spośród porównywanych klasyfikatorów regułowych. Uczył się szybko, a także szybko powracał do poprawnego działania po zajściu zmian.

EN One of challenges for classifiers mining data streams is to properly react to concept drifts. This thesis proposes new algorithms that deal with this problem. First, a new block-based multiple classifier called Batch Weighted Ensemble (BWE) is presented. It incorporates the new Batch Drift Detection Method (BDDM) into the structure of the ensemble. The novelty of BDDM includes: working on blocks and estimating accuracy trends with regression. Experimental evaluation of BWE showed that it achieved the lowest computational costs among compared methods. To improve accuracy, BWE was generalized to Online Batch Weighted Ensemble (OBWE). It incrementally processes learning examples and allows faster reaction to changes. Experimental evaluation of OBWE showed that it has significantly improved the value of the total accuracy. Additionally, a new rule-based incremental learner called RILL was proposed. Its novelty refers to: two-fold knowledge representation, adapting to changes with sliding window and intensive pruning. In experimental evaluation RILL outperformed two related rule classifiers. It learned quite fast and quickly recovered after change occurred.

Liczba stron

142

Dziedzina wg OECD

nauki o komputerach i informatyka

Dyscyplina wg KBN

informatyka

Sygnatura rozprawy w wersji drukowanej

DrOIN 1714

Katalog on-line

to201680910

Pełny tekst rozprawy doktorskiej

Pobierz plik

Poziom dostępu do pełnego tekstu

publiczny

Pierwsza recenzja

Dominik Ślęzak

Miejsce

Warszawa, Polska

Data

15.05.2015

Język

polski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Druga recenzja

Michał Woźniak

Miejsce

Wrocław, Polska

Data

12.02.2015

Język

polski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Status rozprawy

rozprawa doktorska

Miejsce obrony

Poznań, Polska

Data obrony

24.11.2015

Jednostka nadająca tytuł

Rada Wydziału Informatyki Politechniki Poznańskiej

Uzyskany tytuł

doktor nauk technicznych w dyscyplinie: informatyka, w specjalności: uczenie maszynowe

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.