Разработка единого метаязыка морфологии тюркских языков

 В настоящее время в связи с резким увеличением объема информации на естественных языках в интернете и социальных сетях исследование и разработки в области вычислительной лингвистики становятся чрезвычайно актуальными. Как известно, вычислительная лингвистика является новым научным направлением и вх...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Vestnik KazNU. Serii͡a︡ matematika, mekhanika, informatika Jg. 100; H. 4; S. 77 - 87
Hauptverfasser: Sharipbay, А., Gatiatullin, A., Yergesh, B., Kazhymukhan, D.
Format: Journal Article
Sprache:Englisch
Veröffentlicht: Al-Farabi Kazakh National University 24.01.2019
Schlagworte:
ISSN:1563-0277, 2617-4871
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung: В настоящее время в связи с резким увеличением объема информации на естественных языках в интернете и социальных сетях исследование и разработки в области вычислительной лингвистики становятся чрезвычайно актуальными. Как известно, вычислительная лингвистика является новым научным направлением и входит в состав вычислительной науки - информатики. Вычислительная лингвистика включает в себе компьютерную обработку естественных языков (ОЕЯ) – Natural Language Proccesing (NLP). Создание унифицированной системы разметки для тюркских языков (UniTurk) является актуальной задачей для обработки тюркских языков. Единая система разметок позволит унифицировать разметки, облегчить их понимание и использовать общее программное обеспечение, а также проводить различные исследования по лингво-статистическому сравнительному анализу среди тюркских языков. В статье представлены некоторые результаты, полученные в ходе выполнения запланированных работ над международным проектом по созданию многоязычной онтологии и единого метаязыка морфологии тюркских языков. С помощью онтологических моделей формализованы морфологические правила тюркских (казахского, киргизского, татарского, турецкого и узбекского) языков. Результат этих работ могут быть использованы для решения задач NLP, например, для разметка корпусов, в системах извлечения знаний, системах информационного поиска, машинного перевода и т.д.
ISSN:1563-0277
2617-4871
DOI:10.26577/JMMCS-2018-4-557