Проектирование цифрового сервиса извлечения из текстов вакансий структурированной информации о требованиях к соискателю с использованием технологий обработки естественного языка : магистерская диссертация
Gespeichert in:
| Titel: | Проектирование цифрового сервиса извлечения из текстов вакансий структурированной информации о требованиях к соискателю с использованием технологий обработки естественного языка : магистерская диссертация |
|---|---|
| Autoren: | Savoskina, S. V. |
| Weitere Verfasser: | Коломыцева, А. О., Kolomytseva, A. O., УрФУ. Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления |
| Verlagsinformationen: | б. и., 2025. |
| Publikationsjahr: | 2025 |
| Schlagwörter: | LABOR MARKET, МЕТОДЫ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ, TEXT STRUCTURING, VACANCIES, МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ, MASTER'S THESIS, NATURAL LANGUAGE PROCESSING TECHNOLOGIES, САЙТЫ ТРУДОУСТРОЙСТВА, НАВЫКИ, EMPLOYMENT SITES, ТЕХНОЛОГИИ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА, INFORMATION EXTRACTION METHODS, INFORMATION SEARCH ENGINE, ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА, SKILLS, ВАКАНСИИ, СТРУКТУРИЗАЦИЯ ТЕКСТА, РЫНОК ТРУДА |
| Beschreibung: | Работа посвящена решению актуальной практической задачи структуризации текстов вакансий и извлечения из них информации о требуемых навыках для обеспечения возможности применения более эффективных алгоритмов поиска в коллекции документов. Задачи обработки текстов на естественном языке в настоящее время эффективно решаются с помощью методов машинного обучения, однако большая часть из них реализована в рамках конкретных технологий и языков. Поэтому в работе рассматривается вопрос создания отдельного веб-сервиса, реализующего функции обработки текстов вакансий с использованием библиотек для машинного обучения на языке Python и предоставляющего широкому кругу сторонних приложений возможность интеграции с ним посредством RESTful API интерфейса. Структуризация текстов вакансий выполняется с использованием регулярных выражений, кластеризации и классификации, причем извлекаются не только требования к навыкам соискателя, но также и выполняется выделение структуры объявления в виде разделов и заголовков к ним. The paper is devoted to solving the actual practical problem of structuring job texts and extracting information about required skills from them to enable more efficient search algorithms in a collection of documents. Natural language text processing tasks are currently effectively solved using machine learning techniques, but most of them are implemented within specific technologies and languages. Therefore, this paper considers the creation of a separate web service that implements job text processing functions using Python machine learning libraries and provides a wide range of third-party applications with the ability to integrate with it via a RESTful API interface. Job texts are structured using regular expressions, clustering and classification, not only extracting the skill requirements of the job seeker, but also extracting the structure of the advertisement in the form of sections and their headings. |
| Publikationsart: | Master thesis |
| Dateibeschreibung: | application/pdf |
| Sprache: | Russian |
| Zugangs-URL: | http://elar.urfu.ru/handle/10995/140536 |
| Dokumentencode: | edsair.od.......917..c80db62ed9bc866f6495f461a48723bf |
| Datenbank: | OpenAIRE |
| Abstract: | Работа посвящена решению актуальной практической задачи структуризации текстов вакансий и извлечения из них информации о требуемых навыках для обеспечения возможности применения более эффективных алгоритмов поиска в коллекции документов. Задачи обработки текстов на естественном языке в настоящее время эффективно решаются с помощью методов машинного обучения, однако большая часть из них реализована в рамках конкретных технологий и языков. Поэтому в работе рассматривается вопрос создания отдельного веб-сервиса, реализующего функции обработки текстов вакансий с использованием библиотек для машинного обучения на языке Python и предоставляющего широкому кругу сторонних приложений возможность интеграции с ним посредством RESTful API интерфейса. Структуризация текстов вакансий выполняется с использованием регулярных выражений, кластеризации и классификации, причем извлекаются не только требования к навыкам соискателя, но также и выполняется выделение структуры объявления в виде разделов и заголовков к ним.<br />The paper is devoted to solving the actual practical problem of structuring job texts and extracting information about required skills from them to enable more efficient search algorithms in a collection of documents. Natural language text processing tasks are currently effectively solved using machine learning techniques, but most of them are implemented within specific technologies and languages. Therefore, this paper considers the creation of a separate web service that implements job text processing functions using Python machine learning libraries and provides a wide range of third-party applications with the ability to integrate with it via a RESTful API interface. Job texts are structured using regular expressions, clustering and classification, not only extracting the skill requirements of the job seeker, but also extracting the structure of the advertisement in the form of sections and their headings. |
|---|
Nájsť tento článok vo Web of Science