W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Artykuł

Pobierz BibTeX

Tytuł

Hypergraph-based importance assessment for binary classification data

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | [ P ] pracownik | [ S ] student

Dyscyplina naukowa (Ustawa 2.0)

[2.3] Informatyka techniczna i telekomunikacja

Rok publikacji

2023

Opublikowano w

Knowledge and Information Systems

Rocznik: 2023 | Tom: vol. 65 | Numer: iss. 4

Typ artykułu

artykuł naukowy

Język publikacji

angielski

Słowa kluczowe
EN
  • hypergraphs
  • machine learning
  • imbalanced data
  • random undersampling
  • feature selection
Streszczenie

EN We present a novel hypergraph-based framework enabling an assessment of the importance of binary classification data elements. Specifically, we apply the hypergraph model to rate data samples’ and categorical feature values’ relevance to classification labels. The proposed Hypergraph-based Importance ratings are theoretically grounded on the hypergraph cut conductance minimization concept. As a result of using hypergraph representation, which is a lossless representation from the perspective of higher-order relationships in data, our approach allows for more precise exploitation of the information on feature and sample coincidences. The solution was tested using two scenarios: undersampling for imbalanced classification data and feature selection. The experimentation results have proven the good quality of the new approach when compared with other state-of-the-art and baseline methods for both scenarios measured using the average precision evaluation metric.

Data udostępnienia online

25.12.2022

Strony (od-do)

1657 - 1683

DOI

10.1007/s10115-022-01786-2

URL

https://link.springer.com/article/10.1007/s10115-022-01786-2

Typ licencji

CC BY (uznanie autorstwa)

Tryb otwartego dostępu

czasopismo hybrydowe

Wersja tekstu w otwartym dostępie

ostateczna wersja opublikowana

Czas udostępnienia publikacji w sposób otwarty

przed opublikowaniem

Punktacja Ministerstwa / czasopismo

100

Impact Factor

2,7 [Lista 2022]

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.