Upotreba dubokog učenja za klasifikaciju tehničkih dokumenat

Saved in:
Bibliographic Details
Title: Upotreba dubokog učenja za klasifikaciju tehničkih dokumenat
Authors: Kokanović, Karlo
Contributors: Herceg, Marijan
Publisher Information: Sveučilište Josipa Jurja Strossmayera u Osijeku. Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek. Zavod za komunikacije. Katedra za elektroniku i mikroelektroniku., 2025.
Publication Year: 2025
Subject Terms: classification, TECHNICAL SCIENCES. Electrical Engineering. Telecommunications and Informatics, tehnička dokumentacija, deep learning, TEHNIČKE ZNANOSTI. Elektrotehnika. Telekomunikacije i informatika, duboko učenje, GraphSAGE, klasifikacija, technical documentation, Python
Description: As part of this work, a deep neural network model was developed for the classification of technical documentation. For classification of technical documentation, a model was developed that refers to documents of the electricity section within the IPC categorization. For training purposes, a database of 6000 unique documents from six different classes within electricity (H01, H02, H03, H04, H05 and H10) was first collected. Data within each document was extracted using the tesseract algorithm, where both textual and image elements were extracted. The document title and its summary were used from the textual part, and the diagram located on the first page of the document was used for the image part. This information is pre-processed to match the format of the final model. Since the images within the documents differ, the YOLOV5 model was used to classify the images into electronic diagrams or flowcharts. If an image is an electronic schematic, the VGG19 model is applied to it to handle and extract relevant features. If the image is a flowchart, the textual content of that flowchart is extracted and preprocessed. The GraphSAGE neural network graph model was used for document classification. The final deep neural network model achieved significant results during the training, validation and testing process. The model was shown to have consistent prediction with minimal deviations in classification metrics and to be able to correctly handle features within technical documentation.
U sklopu ovog rada razvijen je model duboke neuronske mreže za klasifikaciju tehničke dokumentacije. Tehnička dokumentacija, za čiju je klasifikaciju model razvijen, se odnosi na dokumente odjeljka elektricitet unutar IPC kategorizacije. Za potrebe treniranja najprije je prikupljena baza podataka od 6000 unikatnih dokumenata iz šest različitih klasa unutar elektriciteta (H01, H02, H03, H04, H05 i H10). Podatci unutar svakog dokumenta izvlačeni su putem tesseract algoritma, pri čemu su izdvojeni i tekstualni i slikovni elementi. Od tekstualnog dijela korišteni su naslov dokumenta i njegov sažetak, a za slikovni dio korištena je shema koja se nalazi na prvoj stranici dokumenta. Te su informacije predobrađene kako bi odgovarale formatu konačnog modela. Budući da se slike unutar dokumenata razlikuju, korišten je model YOLOV5 za klasifikaciju slika na elektroničke sheme ili dijagrame tijeka. Ako je neka slika elektronička shema, na nju je primijenjen VGG19 model za rukovanje i izvlačenje relevantnih značajki. Ako je pak slika dijagram tijeka, izvlači se tekstualni sadržaj tog dijagrama i predobrađuje. Za klasifikaciju dokumenata korišten je model graf neuronskih mreža GraphSAGE. Konačni model duboke neuronske mreže postigao je značajne rezultate prilikom procesa treniranja, validacije i testiranja. Pokazano je da model ima konzistentnu predikciju uz minimalna odstupanja metrika klasifikacije te da može pravilno rukovati značajkama unutar tehničke dokumentacije.
Document Type: Master thesis
File Description: application/pdf
Language: Croatian
Access URL: https://repozitorij.etfos.hr/islandora/object/etfos:5513/datastream/PDF
https://urn.nsk.hr/urn:nbn:hr:200:354014
https://repozitorij.etfos.hr/islandora/object/etfos:5513
Rights: URL: http://rightsstatements.org/vocab/InC/1.0/
Accession Number: edsair.od......3912..67c4bd32d6ac7891bd06a1ac6d03736d
Database: OpenAIRE
Be the first to leave a comment!
You must be logged in first