W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Artykuł

Pobierz BibTeX

Tytuł

SeQuiLa: An elastic, fast and scalable SQL-oriented solution for processing and querying genomic intervals

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ 2 ] ETH Zurich | [ P ] pracownik | [ S ] student

Dyscyplina naukowa (Ustawa 2.0)

[2.3] Informatyka techniczna i telekomunikacja

Rok publikacji

2019

Opublikowano w

Bioinformatics

Rocznik: 2019 | Tom: vol. 35 | Numer: iss. 12

Typ artykułu

artykuł naukowy

Język publikacji

angielski

Streszczenie

EN Efficient processing of large-scale genomic datasets has recently become possible due to the application of ‘big data’ technologies in bioinformatics pipelines. We present SeQuiLa—a distributed, ANSI SQL-compliant solution for speedy querying and processing of genomic intervals that is available as an Apache Spark package. Proposed range join strategy is significantly (∼22×) faster than the default Apache Spark implementation and outperforms other state-of-the-art tools for genomic intervals processing.

Data udostępnienia online

14.11.2018

Strony (od-do)

2156 - 2158

DOI

10.1093/bioinformatics/bty940

URL

https://academic.oup.com/bioinformatics/article/35/12/2156/5182295

Punktacja Ministerstwa / czasopismo

200

Punktacja Ministerstwa / czasopismo w ewaluacji 2017-2021

200

Impact Factor

5,61

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.