W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

On Missing Labels, Long-tails and Propensities in Extreme Multi-label Classification

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | [ D ] doktorant | [ P ] pracownik

Dyscyplina naukowa (Ustawa 2.0)

[2.3] Informatyka techniczna i telekomunikacja

Rok publikacji

2022

Typ rozdziału

rozdział w monografii naukowej / referat

Język publikacji

angielski

Słowa kluczowe
EN
  • extreme classification
  • multi-label classification
  • propensity model
  • missing labels
  • long-tail labels
  • recommendation
Streszczenie

PL The propensity model introduced by Jain et al has become a standard approach for dealing with missing and long-tail labels in extreme multi-label classification (XMLC). In this paper, we critically revise this approach showing that despite its theoretical soundness, its application in contemporary XMLC works is debatable. We exhaustively discuss the flaws of the propensity-based approach, and present several recipes, some of them related to solutions used in search engines and recommender systems, that we believe constitute promising alternatives to be followed in XMLC.

Data udostępnienia online

14.08.2022

Strony (od-do)

1547 - 1557

DOI

10.1145/3534678.3539466

URL

https://dl.acm.org/doi/pdf/10.1145/3534678.3539466

Książka

Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining KDD '22

Zaprezentowany na

28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), 14-18.08.2022, Washington, United States

Typ licencji

copyright

Tryb otwartego dostępu

witryna wydawcy

Wersja tekstu w otwartym dostępie

ostateczna wersja opublikowana

Czas udostępnienia publikacji w sposób otwarty

w momencie opublikowania

Punktacja Ministerstwa / rozdział

20

Punktacja Ministerstwa / konferencja (CORE)

200

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.