Implementing and Testing a Simple Algorithm for Consistent Query Answering ; Lihtsa andmebaasipäringutele kooskõlaliste vastuste leidmise algoritmi teostamine ja testimine

Saved in:
Bibliographic Details
Title: Implementing and Testing a Simple Algorithm for Consistent Query Answering ; Lihtsa andmebaasipäringutele kooskõlaliste vastuste leidmise algoritmi teostamine ja testimine
Authors: Kimst, Mattias
Contributors: Hannula, Miika Juhani, juhendaja, Tartu Ülikool. Loodus- ja täppisteaduste valdkond, Tartu Ülikool. Arvutiteaduse instituut
Publisher Information: Tartu Ülikool
Publication Year: 2025
Collection: University of Tartu: Dspace
Subject Terms: logic, ebakõla, primary key, database, loogika, andmebaas, päring, primaarvõti, inconsistency, query, bakalaureusetööd, informaatika, infotehnoloogia, informatics, infotechnology
Description: To address inconsistencies in databases, data cleaning is commonly used; however, it can be complex or may result in the loss of some data. As an alternative, the consistent query answering (CQA) paradigm has been developed to provide consistent query results without altering the database. In this thesis, an algorithm for CQA for primary key violations and conjunctive queries is implemented in the Java programming language and its performance is evaluated on synthetically generated data. Additionally, the database purification technique is tested as an option to enhance the algorithm’s performance. The results indicate that purification significantly improves performance. However, regardless of the use of purification, the algorithm’s runtime increases rapidly as the database size grows. ; Tavaliselt, et tulla toime ebakõladega andmebaasis, see puhastatakse, mis aga võib olla keeruline või võib osa infot kaotsi minna. Alternatiivina on välja pakutud meetod ebakõladeta päringuvastuste leidmiseks andmebaasi muutmata. Selles töös teostatakse taoline algoritm keeles Java ja hinnatakse algoritmi jõudlust sünteetiliselt genereeritud andmetel. Algoritm on kasutatav primaarvõtme kitsenduse rikkumiste ja konjunktiivsete päringute korral. Lisaks proovitakse andmebaasist päringu suhtes ebaoluliste andmete eemaldamist jõudluse parandamiseks. Tulemused näitavad, et viimane vähendab oluliselt algoritmi käitusaega, kuigi sõltumata ebaoluliste andmete eemaldamisest käitusaeg kasvab andmebaasi mahu suurenemisel kiiresti.
Document Type: thesis
File Description: application/pdf
Language: Estonian
Relation: https://hdl.handle.net/10062/117159
Availability: https://hdl.handle.net/10062/117159
Rights: https://creativecommons.org/licenses/by-nc-nd/4.0/
Accession Number: edsbas.76CBCCD4
Database: BASE
Description
Abstract:To address inconsistencies in databases, data cleaning is commonly used; however, it can be complex or may result in the loss of some data. As an alternative, the consistent query answering (CQA) paradigm has been developed to provide consistent query results without altering the database. In this thesis, an algorithm for CQA for primary key violations and conjunctive queries is implemented in the Java programming language and its performance is evaluated on synthetically generated data. Additionally, the database purification technique is tested as an option to enhance the algorithm’s performance. The results indicate that purification significantly improves performance. However, regardless of the use of purification, the algorithm’s runtime increases rapidly as the database size grows. ; Tavaliselt, et tulla toime ebakõladega andmebaasis, see puhastatakse, mis aga võib olla keeruline või võib osa infot kaotsi minna. Alternatiivina on välja pakutud meetod ebakõladeta päringuvastuste leidmiseks andmebaasi muutmata. Selles töös teostatakse taoline algoritm keeles Java ja hinnatakse algoritmi jõudlust sünteetiliselt genereeritud andmetel. Algoritm on kasutatav primaarvõtme kitsenduse rikkumiste ja konjunktiivsete päringute korral. Lisaks proovitakse andmebaasist päringu suhtes ebaoluliste andmete eemaldamist jõudluse parandamiseks. Tulemused näitavad, et viimane vähendab oluliselt algoritmi käitusaega, kuigi sõltumata ebaoluliste andmete eemaldamisest käitusaeg kasvab andmebaasi mahu suurenemisel kiiresti.