W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

Discovering Minority Sub-clusters and Local Difficulty Factors from Imbalanced Data

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] pracownik | [ S ] student

Dyscyplina naukowa (Ustawa 2.0)

[2.3] Informatyka techniczna i telekomunikacja

Rok publikacji

2017

Typ rozdziału

rozdział w monografii naukowej / referat

Język publikacji

angielski

Słowa kluczowe
EN
  • class imbalance
  • minority class categorization
  • data difficulty factors
  • class overlapping
  • minority sub-clusters
Streszczenie

EN Learning classifiers from imbalanced data is particularly challenging when class imbalance is accompanied by local data difficulty factors, such as outliers, rare cases, class overlapping, or minority class decomposition. Although these issues have been highlighted in previous research, there have been no proposals of algorithms that simultaneously detect all the aforementioned difficulties in a dataset. In this paper, we put forward two extensions to popular clustering algorithms, ImKmeans and ImScan, and one novel algorithm, ImGrid, that attempt to detect minority sub-clusters, outliers, rare cases, and class overlapping. Experiments with artificial datasets show that ImGrid, which uses a Bayesian test to join similar neighboring regions, is able to re-discover simulated clusters and types of minority examples on par with competing methods, while being the least sensitive to parameter tuning.

Data udostępnienia online

16.09.2017

Strony (od-do)

324 - 339

DOI

10.1007/978-3-319-67786-6_23

URL

https://link.springer.com/chapter/10.1007/978-3-319-67786-6_23

Książka

Discovery Science : 20th International Conference, DS 2017, Kyoto, Japan, October 15–17, 2017 : Proceedings

Zaprezentowany na

20th International Conference on Discovery Science DS 2017, 15-17.10.2017, Kyoto, Japan

Punktacja Ministerstwa / rozdział

20

Punktacja Ministerstwa / konferencja (CORE)

20

Publikacja indeksowana w

WoS (15)

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.