W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

Dealing with Data Difficulty Factors While Learning from Imbalanced Data

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik

Rok publikacji

2016

Typ rozdziału

rozdział w monografii naukowej

Język publikacji

angielski

Streszczenie

EN Learning from imbalanced data is still one of challenging tasks in machine learning and data mining. We discuss the following data difficulty factors which deteriorate classification performance: decomposition of the minority class into rare sub-concepts, overlapping of classes and distinguishing different types of examples. New experimental studies showing the influence of these factors on classifiers are presented. The paper also includes critical discussions of methods for their identification in real world data. Finally, open research issues are stated.

Strony (od-do)

333 - 363

DOI

10.1007/978-3-319-18781-5_17

URL

https://link.springer.com/chapter/10.1007/978-3-319-18781-5_17

Książka

Challenges in Computational Statistics and Data Mining

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.