Processing may take a few seconds...

Dissertation

Title

GRASShopPER – wydajna metoda asemblacji de novo wykorzystująca strategię Overlap-Layout-Consensus

Authors

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee

Promoter

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee

Supporting promoter

[ 1 ] Instytut Informatyki, Wydział Informatyki, Politechnika Poznańska | [ P ] employee

Reviewers

Title variant

EN GRASShopPER – the new efficient approach to de novo genome assembly using Overlap-Layout-Consensus strategy

Language

polish

Keywords
PL
  • asemblacja
  • sekwencjonowanie
  • bioinformatyka
  • heurystyka
EN
  • assembly
  • sequencing
  • bioinformatics
  • heuristic
Abstract

PL Asemblacja DNA stanowi jeden z kluczowych elementów złożonego procesu sekwencjonowania materiału genetycznego. Istotą procesu asemblacji jest rekonstrukcja możliwie długiej sekwencji nukleotydów materiału genetycznego przy wykorzystaniu jego krótkich lecz silnie, przy tym nierównomiernie, nakładających się fragmentów. Fragmenty podlegające takiej rekonstrukcji, określane mianem odczytów, z powodu ograniczeń technologicznych nie mogą być wydłużone na etapie mechanicznego odczytu, a ich długość jest nieporównywalnie mniejsza od długości rekonstruowanej sekwencji. Proces asemblacji, przy obecnym stanie techniki stanowi zatem jedyny możliwy automatyczny sposób uzyskania sekwencji odczytywanych genomów w postaci ciągłej. Praca stanowi szerokie omówienie nowego algorytmu asemblacji GRASShopPER, współautorem którego jest autor pracy. Główny wkład autora, oprócz samej idei kryjącej się za metodą, dotyczy dwóch podprocedur GRASShopPERa: kroku znajdowania znaczących rozwidleń grafu nałożeń oraz metody składania konsensusu w procedurze progresywnego dopasowania sekwencji.

EN Assembly can be perceived as a joint venture of computer science, biology, chemistry and medicine. Aim of the assembly problem is to find shortest common superstrings (contigs) built upon a given known set of sequences, called reads. Although the problem can be seen more general, we can assume reads come from intensive genetic material scan. The problem is very practical as at the current level of technology machines that provide reads, known as sequencers, are unable to determine entire sequence of a genome. Instead they provide relatively short genome fragments, though densely covering the genome. The thesis discusses the new approach to de novo assembly taking use of Overlap-Layout-Consensus strategy to provide high quality results, but taking advantage of a new technologies like GPUs to make it as efficient as possible. The main authors contribution to the method, apart from co-authorship of an idea behind the method itself, is a creation of its two core subrutines: overlap graph traversal step and the consensus alignment agreement phase.

Number of pages

158

OECD domain

computer sciences and computer science

KBN discipline

computer science

Signature of printed version

DrOIN 1969

On-line catalog

to2018998335

Full text of dissertation

Download file

Access level to full text

public

First review

Norbert Dojer

Place

Warszawa, Polska

Date

22.03.2019

Language

polish

Review text

Download file

Access level to review text

public

Second review

Franciszek Seredyński

Place

Warszawa, Polska

Date

15.01.2019

Language

polish

Review text

Download file

Access level to review text

public

Dissertation status

dissertation

Place of defense

Poznań, Polska

Date of defense

18.04.2019

Unit granting title

Rada Wydziału Informatyki Politechniki Poznańskiej

Obtained title

doktor nauk technicznych w dyscyplinie: informatyka, w specjalności: bioinformatyka