W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozprawa doktorska

Pobierz BibTeX

Tytuł

Block-based and Online Ensembles for Concept-drifting Data Streams

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik

Promotor

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik

Recenzenci

Wariant tytułu

PL Blokowe i przyrostowe klasyfikatory złożone dla strumieni danych ze zmienna definicja klas

Język

angielski

Słowa kluczowe
EN
  • data streams
  • concept drift
  • classification
  • data mining
PL
  • uczenie maszynowe
  • klasyfikacja
  • strumienie danych
  • dryft
Streszczenie

EN This thesis investigates classification methods for concept-drifting data streams. We propose the Accuracy Updated Ensemble (AUE) algorithm, which reacts equally well to sudden, gradual, and recurring drifts in block-based data streams. Furthermore, the thesis analyzes three generic strategies for transforming block-based ensemble classifiers into online learners: a) using a sliding window, b) adding a single incremental classifier, c) using a drift detector. Based on this analysis, we propose an online ensemble algorithm called Online Accuracy Updated Ensemble (OAUE), which reacts to several types of changes online. Finally, the thesis reviews existing evaluation methods used to assess stream classifiers and proposes a new measure, called Prequential AUC, which is capable of evaluating classifiers online, on class-imbalanced data streams. All of the proposed algorithms are experimentally compared against competitive classification and evaluation methods.

PL Badania przedstawione w pracy dotyczą klasyfikacji strumieni danych ze zmienną definicja klas. W rozprawie zaproponowano algorytm AUE, który reaguje na nagłe, stopniowe i nawracające zmiany w środowiskach blokowych. Ponadto, przeanalizowano w pracy trzy strategie dostosowujące algorytmy blokowe do środowisk przyrostowych: a) wykorzystanie metody okien przesuwnych, b) dodanie pojedynczego klasyfikatora przyrostowego, c) wykorzystanie detektora dryftu. W oparciu o analizę wymienionych trzech strategii, zaproponowany został algorytm OAUE, który przyrostowo uczy i ocenia klasyfikatory składowe zgodnie z najlepszymi strategiami reakcji na zmiany. W pracy zaproponowano również nową miarę oceny klasyfikatorów, o nazwie Prequential AUC, przystosowaną do przyrostowego przetwarzania strumieni o niezrównoważonych rozkładach klas. Wszystkie zaproponowane algorytmy zostały eksperymentalnie porównane z szeroką gamą istniejących metod uczenia i oceny klasyfikatorów strumieniowych.

Liczba stron

171

Dziedzina wg OECD

nauki o komputerach i informatyka

Dyscyplina wg KBN

informatyka

Sygnatura rozprawy w wersji drukowanej

DrOIN 1678

Katalog on-line

to201480848

Pełny tekst rozprawy doktorskiej

Pobierz plik

Poziom dostępu do pełnego tekstu

publiczny

Pierwsza recenzja

Leszek Rutkowski

Miejsce

Częstochowa, Polska

Data

23.04.2015

Język

polski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Druga recenzja

Henryk Rybiński

Miejsce

Warszawa, Polska

Data

15.05.2015

Język

polski

Tekst recenzji

Pobierz plik

Poziom dostępu do recenzji

publiczny

Status rozprawy

rozprawa doktorska

Miejsce obrony

Poznań, Polska

Data obrony

22.06.2015

Jednostka nadająca tytuł

Rada Wydziału Informatyki Politechniki Poznańskiej

Uzyskany tytuł

doktor nauk technicznych w dyscyplinie: informatyka, w specjalności: eksploracja danych

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.