Recovery algorithms in State Machine Replication with volatile and non-volatile main memory
[ 1 ] Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | [ P ] employee
[ 1 ] Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | [ P ] employee
PL Algorytmy odtwarzania stanu dla zreplikowanej maszyny stanowej z pamięcią ulotną i nieulotną
english
- MultiPaxos
- state machine replication
- crash-recovery
- MultiPaxos
- replikacja maszyny stanowej
- odtwarzanie po awarii
EN State Machine Replication (SMR) allows to build strongly consistent distributed systems that are resilient to failures, including machine crashes. SMR is commonly build on top of a consensus algorithm, prevalently the Paxos algorithm. While tolerating machine crashes in Paxos-based SMR allows for retaining performance of the replicated State Machine, the ability to recover a crashed machine noticeably worsens throughput and latency, for vital data must be stored durably on performance critical path. The dissertation presents two ways to lessen or overcome the overhead. Firstly, by leveraging persistent memory, a novel tier in memory-storage hierarchy, that allows for faster durable stores. Secondly, by taking advantage of an additional assumption that anytime a majority of machines is up, and recovering from other machines rather than storage. The proposed solutions are described in details, and are thoroughly evaluated. The proposed systems improve over the existing, yet which to choose depends on workload, hence appropriate guidelines are given.
PL Zreplikowana Maszyna Stanowa (SMR) to podejście pozwalające tworzyć silnie spójne systemy rozproszone odporne na awarie, w tym awarie maszyn. Do budowy systemów SMR używa się protokołów konsensusu, wśród których najpopularniejszym jest Paxos. Zbudowanie tolerującego awarie systemu SMR w oparciu o Paxos pozwala na pracę zreplikowanej maszyny bez utraty wydajności. Jeśli jednak odtwarzanie maszyn ma być wspierane, przepustowość i opóźnienie pogarszają się, gdyż część zapisów na krytycznej dla wydajności ścieżce musi być wykonywana synchronicznie. Rozprawa rozważa dwa sposoby na poprawę wydajności przy wsparciu odtwarzania. Pierwszy wykorzystuje pamięć trwałą, nowy rodzaj pamięci łączący cechy DRAM i dysku. Drugi zakłada że w każdej chwili większość maszyn jest sprawna i odzyskuje dane z innych maszyn. Proponowane rozwiązania są opisane od strony teoretycznej, a ich prototypy zbadane eksperymentalnie. Rozwiązania poprawiają wydajność w porównaniu do istniejących, a wybór najlepszego zależy od zastosowania, stąd rozprawa określa kiedy która metoda jest optymalna.
108
engineering and technical sciences
information and communication technology
DrOIN 2198
public
Alysson Bessani
Lisbon, Portugal
26.08.2022
english
public
Fernando Pedone
Lugano, Switzerland
29.08.2022
english
public
dissertation
Poznań, Polska
21.09.2022
Rada Dyscypliny Informatyka Techniczna i Telekomunikacja Politechniki Poznańskie
doktor nauk inżynieryjno-technicznych w dyscyplinie: informatyka techniczna i telekomunikacja