W zależności od ilości danych do przetworzenia generowanie pliku może się wydłużyć.

Jeśli generowanie trwa zbyt długo można ograniczyć dane np. zmniejszając zakres lat.

Rozdział

Pobierz BibTeX

Tytuł

Improving Quality of Code Review Datasets – Token-Based Feature Extraction Method

Autorzy

[ 1 ] Instytut Informatyki, Wydział Informatyki i Telekomunikacji, Politechnika Poznańska | [ P ] pracownik

Dyscyplina naukowa (Ustawa 2.0)

[2.3] Informatyka techniczna i telekomunikacja

Rok publikacji

2021

Typ rozdziału

rozdział w monografii naukowej / referat

Język publikacji

angielski

Streszczenie

EN Machine learning is used increasingly frequent in software engineering to automate tasks and improve the speed and quality of software products. One of the areas where machine learning starts to be used is the analysis of software code. The goal of this paper is to evaluate a new method for creating machine learning feature vectors, based on the content of a line of code. We designed a new feature extraction algorithm and evaluated it in an industrial case study. Our results show that using the new feature extraction technique improves the overall performance in terms of MCC (Matthews Correlation Coefficient) by 0.39 – from 0.31 to 0.70, while reducing the precision by 0.05. The implications of this is that we can improve overall prediction accuracy for both true positives and true negatives significantly. This increases the trust in the predictions by the practitioners and contributes to its deeper adoption in practice.

Strony (od-do)

81 - 93

DOI

10.1007/978-3-030-65854-0_7

URL

https://link.springer.com/chapter/10.1007/978-3-030-65854-0_7

Książka

Software Quality: Future Perspectives on Software Engineering Quality : 13th International Conference, SWQD 2021, Vienna, Austria, January 19–21, 2021, Proceedings

Zaprezentowany na

13th International Conference on Software Quality: Future Perspectives on Software Engineering Quality SWQD 2021, 19-21.01.2021, Vienna, Austria

Punktacja Ministerstwa / rozdział

20

Ta strona używa plików Cookies, w celu zapamiętania uwierzytelnionej sesji użytkownika. Aby dowiedzieć się więcej przeczytaj o plikach Cookies i Polityce Prywatności.