W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

Conceptual Clustering Using Lingo Algorithm: Evaluation on Open Directory Project Data

Autorzy

[ 1 ] Instytut Informatyki (II), Wydział Informatyki i Zarządzania, Politechnika Poznańska | [ P ] pracownik

Rok publikacji

2004

Typ rozdziału

rozdział w monografii naukowej / referat

Język publikacji

angielski

Streszczenie

EN Search results clustering problem is defined as an automatic, on-line grouping of similar documents in a search hits list, returned from a search engine. In this paper we present the results of an experimental evaluation of a new algorithm named Lingo. We use Open Directory Project as a source of high-quality narrow-topic document references and mix them into several multi-topic test sets for the algorithm We then compare the clusters acquired from Lingo to the expected set of ODP categories mixed in the input. Finally we discuss observations from the experiment, highlighting the algorithm’s strengths and weaknesses and conclude with research directions for the future.

Strony (od-do)

369 - 377

DOI

10.1007/978-3-540-39985-8_38

URL

https://link.springer.com/chapter/10.1007/978-3-540-39985-8_38

Książka

Intelligent Information Processing and Web Mining : Proceedings of the International IIS: IIPWM‘04 Conference held in Zakopane, Poland, May 17–20, 2004

Zaprezentowany na

International IIS: IIPWM‘04 Conference, 17-20.05.2004, Zakopane, Polska

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.