W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

A Comparison of Two Approaches to Data Mining from Imbalanced Data

Autorzy

[ 1 ] Instytut Informatyki (II), Wydział Informatyki i Zarządzania, Politechnika Poznańska | [ P ] pracownik

Rok publikacji

2004

Typ rozdziału

referat

Język publikacji

angielski

Streszczenie

EN Our objective is a comparison of two data mining approaches to dealing with imbalanced data sets. The first approach is based on saving the original rule set, induced by the LEM2 algorithm, and changing the rule strength for all rules for the smaller class (concept) during classification. In the second approach, rule induction was split: the rule set for the larger class was induced by LEM2, while the rule set for the smaller class was induced by EXPLORE, another data mining algorithm. Results of our experiments show that both approaches increase the sensitivity compared to the original LEM2. However, the difference in performance of both approaches is statistically insignificant. Thus the appropriate approach to dealing with imbalanced data sets should be selected individually for a specific data set.

Strony (od-do)

757 - 763

DOI

10.1007/978-3-540-30132-5_103

URL

https://link.springer.com/chapter/10.1007/978-3-540-30132-5_103

Książka

Knowledge-Based Intelligent Information and Engineering Systems : 8th International Conference, KES 2004, Wellington, New Zealand, September 20-25, 2004, Proceedings, Part I

Zaprezentowany na

8th International Conference on Knowledge-Based and Intelligent Information and Engineering Systems KES 2004, 20-25.09.2004, Wellington, New Zealand

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.