SIS PUT | End-to-end approach to classification in unstructured spaces with application to judicial decisions

Scientific Information System of the Poznań University of Technology

PL EN

Main page / Dissertations / End-to-end approach to classification in unstructured spaces with application to judicial decisions

Submit a comment

Dissertation

Download BibTeX

Title

End-to-end approach to classification in unstructured spaces with application to judicial decisions

Authors

Alexandre Quemy (WIiT) ^{[ 1 ][ D ]}

^{[ 1 ]} Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | ^{[ D ]} phd student

Promoter

Robert Wrembel (WIiT) ^{[ 1 ][ P ]}

^{[ 1 ]} Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | ^{[ P ]} employee

Reviewers

Title variant

PL Całościowe podejście do problemu klasyfikacji danych o nieokreślonych metrykach w zastosowaniu decyzji sądowniczych

Language

english

Keywords

data pipeline
machine learning
classification
meta-optimization
autoML

potok danych
uczenie maszynowe
klasyfikacja
meta-optymalizacja
autoML

Abstract

EN In this dissertation we proposed an end-to-end approach to building data processing pipelines (DPPs) with machine learning (ML). It is based on the three following solutions. First, we developed a technique for automatic construction and configuration of a DPP, to pre-process data for an arbitrary ML algorithm. The DPP construction was formulated as an optimization problem and solved based on existing meta-optimizers. Second, we proposed the Hypergraph Case-Based Reasoning method that includes a generic algorithm that can process data of arbitrary types and can learn complex models based on few hyper-parameters. As a consequence, model building time and user engagement time are reduced. Third, we developed the largest open access repository (https://echr-opendata.eu/) of documents related to the European Court of Human Rights. Data in this repository were pre-processed to formats required by classification algorithms.

PL W niniejszej rozprawie zaproponowaliśmy całościowe podejście do konstruowania potoku danych z uczeniem maszynowym, bazujące na trzech rozwiązaniach. Po pierwsze, opracowaliśmy sposób automatycznego budowania i konfigurowania potoku danych w celu przygotowania danych dla dowolnego algorytmu uczenia maszynowego. Konstrukcja potoku została sformułowana jako problem optymalizacji i rozwiązana w oparciu o istniejące meta-optymalizatory. Po drugie, opracowaliśmy metodę Hypergraph Case-Based Reasoning z generycznym algorytmem, który może przetwarzać dane dowolnego typu i uczyć się złożonych modeli, wykorzystujący przy tym niewielką liczbę hiper-parametrów. Dzięki temu, czas budowy modeli i zaangażowania użytkownika ulega skróceniu. Po trzecie, opracowaliśmy otwarte repozytorium danych prawnych (https://echr-opendata.eu/), zawierające sprawy sądowe i orzeczenia z Europejskiego Trybunału Praw Człowieka. Dane w repozytorium zostały wcześniej przetworzone do postaci wymaganej przez algorytmy klasyfikacji.

Number of pages

223

OECD domain

engineering and technical sciences

KBN discipline

computer science

Signature of printed version

DrOIN 2112

On-line catalog

to2021998645

Full text of dissertation

Download file

Access level to full text

public

First review

Silvia Chiusano

Place

Torino, Italy

Date

10.02.2021

Language

english

Review text

Download file

Access level to review text

public

Second review

Jérôme Darmont

Place

Lyon, France

Date

28.01.2021

Language

english

Review text

Download file

Access level to review text

public

Dissertation status

dissertation

Place of defense

Poznań, Polska

Date of defense

12.03.2021

Unit granting title

Rada Dyscypliny Informatyka Techniczna i Telekomunikacja

Obtained title

doktor nauk inżynieryjno-technicznych w dyscyplinie: informatyka techniczna i telekomunikacja

System created by Poznań University of Technology and Poznan Supercomputing and Networking Center