Модели представления данных в системах автоматической обработки текстов

Uloženo v:
Podrobná bibliografie
Název: Модели представления данных в системах автоматической обработки текстов
Informace o vydavateli: ООО Цифра, 2024.
Rok vydání: 2024
Témata: центроидно-контекстная модель, centroid-context model, automatic text processing, автоматическая обработка текстов, phraseological conceptual analysis, фразеологический концептуальный анализ, концептуальный анализ, метод лингвистической аналогии, conceptual analysis, method of linguistic analogy
Popis: В статье рассматриваются современные подходы к обработке текстовых данных. Представлены уникальные модели, включая универсальную центроидно-контекстную модель (ЦКМ) и позиционную концептуальную модель представления понятий. Идея ЦКМ состоит в создании новых классов слов, ориентированных на схожесть грамматических признаков слов и их синтаксических функций в предложении. Тогда как модели, положенные в основу концептуального анализа текстов, позволяют выявить текстовую понятийную систему и установить смысловые отношения между ее элементами. Выявление системы понятий производится точными и предиктивными методами. Точное выделение понятий производится по эталонным концептуальным словарям (ЭКС). Предиктивное выделение понятий осуществляется по словарю концептуальных шаблонов. Обсуждаются модели представления данных и извлечения признаков из текстовых объектов с применением упорядоченных последовательностей и вектор-функций.
The article examines modern approaches to textual data processing. Unique models are presented, including the universal centroid-context model (CCM) and the positional conceptual model of concept representation. The idea behind the CCM is to create new word classes centred on the similarity of words' grammatical properties and their syntactic functions in a sentence. Whereas the models underlying the conceptual analysis of texts allow to identify the textual conceptual system and to establish semantic relations between its elements. The identification of the concept system is done by exact and predictive methods. Precise selection of concepts is performed using reference conceptual dictionaries (RCD). Predictive concept extraction is done by conceptual pattern dictionary. Models of data representation and feature extraction from text objects using ordered sequences and vector functions are discussed.
Cifra. Информационные технологии и телекоммуникации, Выпуск 2 (2) 2024
Druh dokumentu: Article
Jazyk: Russian
DOI: 10.18454/itech.2024.2.3
Rights: CC BY
Přístupové číslo: edsair.doi...........aa6c95f2aa93aad9a9690136f5f4e6dc
Databáze: OpenAIRE
Popis
Abstrakt:В статье рассматриваются современные подходы к обработке текстовых данных. Представлены уникальные модели, включая универсальную центроидно-контекстную модель (ЦКМ) и позиционную концептуальную модель представления понятий. Идея ЦКМ состоит в создании новых классов слов, ориентированных на схожесть грамматических признаков слов и их синтаксических функций в предложении. Тогда как модели, положенные в основу концептуального анализа текстов, позволяют выявить текстовую понятийную систему и установить смысловые отношения между ее элементами. Выявление системы понятий производится точными и предиктивными методами. Точное выделение понятий производится по эталонным концептуальным словарям (ЭКС). Предиктивное выделение понятий осуществляется по словарю концептуальных шаблонов. Обсуждаются модели представления данных и извлечения признаков из текстовых объектов с применением упорядоченных последовательностей и вектор-функций.<br />The article examines modern approaches to textual data processing. Unique models are presented, including the universal centroid-context model (CCM) and the positional conceptual model of concept representation. The idea behind the CCM is to create new word classes centred on the similarity of words' grammatical properties and their syntactic functions in a sentence. Whereas the models underlying the conceptual analysis of texts allow to identify the textual conceptual system and to establish semantic relations between its elements. The identification of the concept system is done by exact and predictive methods. Precise selection of concepts is performed using reference conceptual dictionaries (RCD). Predictive concept extraction is done by conceptual pattern dictionary. Models of data representation and feature extraction from text objects using ordered sequences and vector functions are discussed.<br />Cifra. Информационные технологии и телекоммуникации, Выпуск 2 (2) 2024
DOI:10.18454/itech.2024.2.3