W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

A greedy approach to concurrent processing of frequent itemset queries

Autorzy

[ 1 ] Instytut Informatyki (II), Wydział Informatyki i Zarządzania, Politechnika Poznańska | [ P ] pracownik

Rok publikacji

2006

Typ rozdziału

referat

Język publikacji

angielski

Streszczenie

EN We consider the problem of concurrent execution of multiple frequent itemset queries. If such data mining queries operate on overlapping parts of the database, then their overall I/O cost can be reduced by integrating their dataset scans. The integration requires that data structures of many data mining queries are present in memory at the same time. If the memory size is not sufficient to hold all the data mining queries, then the queries must be scheduled into multiple phases of loading and processing. Since finding the optimal assignment of queries to phases is infeasible for large batches of queries due to the size of the search space, heuristic algorithms have to be applied. In this paper we formulate the problem of assigning the queries to phases as a particular case of hypergraph partitioning. To solve the problem, we propose and experimentally evaluate two greedy optimization algorithms.

Strony (od-do)

292 - 301

DOI

10.1007/11823728_28

URL

https://link.springer.com/chapter/10.1007/11823728_28

Książka

Data Warehousing and Knowledge Discovery : 8th International Conference, DaWaK 2006, Krakow, Poland, September 4-8, 2006 : Proceedings

Zaprezentowany na

8th International Conference on Data Warehousing and Knowledge Discovery DaWaK 2006, 4-8.09.2006, Kraków, Polska

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.