Частоты встречаемости последовательностей частей речи в тексте и психофизиологические характеристики его автора: корпусное исследование
Gespeichert in:
| Titel: | Частоты встречаемости последовательностей частей речи в тексте и психофизиологические характеристики его автора: корпусное исследование |
|---|---|
| Quelle: | Вестник Иркутского государственного лингвистического университета. |
| Verlagsinformationen: | Евразийский лингвистический институт в г. Иркутске – филиал ФГБОУ ВПО «МГЛУ», 2014. |
| Publikationsjahr: | 2014 |
| Schlagwörter: | ТЕКСТ, АВТОР, АВТОРОВЕДЕНИЕ, ДИАГНОСТИЧЕСКОЕ АВТОРОВЕДЕНИЕ, ЛИНГВОСТАТИСТИКА, СТИЛЕМЕТРИЯ, МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА, СЛУЖЕБНЫЕ СЛОВА, ПОСЛЕДОВАТЕЛЬНОСТИ ЧАСТЕЙ РЕЧИ, НЕЙРОЛИНГВИСТИКА |
| Beschreibung: | Текст как продукт речевой деятельности несет информацию о личности его автора, его индивидуальных особенностях, причем эту информацию можно почерпнуть путем анализа текста на разных уровнях (лексическом, морфологическом, синтаксическом и др.). В работе рассматривается проблема поиска неподконтрольных сознанию пишущего, формальнограмматических параметров текстов, частоты встречаемости которых могут иметь устойчивые корреляции с теми или иными характеристиками личности и быть использованы для моделирования личности автора текста. Как показывает обзор англоязычной научной литературы, одним из таких параметров могут быть не только количественные соотношения в тексте слов разных частей речи, но и частоты встречаемости в нем тех или иных последовательностей частей речи, состоящих из двух слов (например, прилагательное + существительное) (биграмм). В статье впервые на материале русского языка рассматривается возможность использования частот встречаемости в тексте тех или иных биграмм частей речи как диагностического параметра текста. С применением статистических методов выявлены устойчивые корреляции между характеристиками личности авторов текстов и частотами встречаемости биграмм частей речи. Отмечается, что полученные статистически значимые зависимости следует интерпретировать с учетом данных психологии, психолингвистики, нейролингвистики. The paper investigates the problem of unconscious formal grammatical parameters of the text which are stably correlated with certain personality traits and can be used in authorship attribution to create a personality profile of the author of the written text. The analysis of the scientific literature suggests that one of these parameters can be speech sequences. The attempt has been made to examine a possible use of part of speech tagging as an attribution parameter of the text using the material of a collected corpus of students’ essays with metatags with the information about the authors. Stable correlations are obtained between the personality traits and part of speech tagging, regression models are obtained that prove to be highly accurate. It should be noted that this kind of approach extensively used by contemporary science should be supplemented with psychological, psycholinguistic and cognitive data in order for the theoretical justification to be obtained. |
| Publikationsart: | Article |
| Dateibeschreibung: | text/html |
| Sprache: | Russian |
| ISSN: | 1997-0730 |
| Zugangs-URL: | http://cyberleninka.ru/article/n/chastoty-vstrechaemosti-posledovatelnostey-chastey-rechi-v-tekste-i-psihofiziologicheskie-harakteristiki-ego-avtora-korpusnoe http://cyberleninka.ru/article_covers/15666180.png |
| Dokumentencode: | edsair.od......2806..e8fb772e43e7c73f42478da98c080840 |
| Datenbank: | OpenAIRE |
| Abstract: | Текст как продукт речевой деятельности несет информацию о личности его автора, его индивидуальных особенностях, причем эту информацию можно почерпнуть путем анализа текста на разных уровнях (лексическом, морфологическом, синтаксическом и др.). В работе рассматривается проблема поиска неподконтрольных сознанию пишущего, формальнограмматических параметров текстов, частоты встречаемости которых могут иметь устойчивые корреляции с теми или иными характеристиками личности и быть использованы для моделирования личности автора текста. Как показывает обзор англоязычной научной литературы, одним из таких параметров могут быть не только количественные соотношения в тексте слов разных частей речи, но и частоты встречаемости в нем тех или иных последовательностей частей речи, состоящих из двух слов (например, прилагательное + существительное) (биграмм). В статье впервые на материале русского языка рассматривается возможность использования частот встречаемости в тексте тех или иных биграмм частей речи как диагностического параметра текста. С применением статистических методов выявлены устойчивые корреляции между характеристиками личности авторов текстов и частотами встречаемости биграмм частей речи. Отмечается, что полученные статистически значимые зависимости следует интерпретировать с учетом данных психологии, психолингвистики, нейролингвистики.<br />The paper investigates the problem of unconscious formal grammatical parameters of the text which are stably correlated with certain personality traits and can be used in authorship attribution to create a personality profile of the author of the written text. The analysis of the scientific literature suggests that one of these parameters can be speech sequences. The attempt has been made to examine a possible use of part of speech tagging as an attribution parameter of the text using the material of a collected corpus of students’ essays with metatags with the information about the authors. Stable correlations are obtained between the personality traits and part of speech tagging, regression models are obtained that prove to be highly accurate. It should be noted that this kind of approach extensively used by contemporary science should be supplemented with psychological, psycholinguistic and cognitive data in order for the theoretical justification to be obtained. |
|---|---|
| ISSN: | 19970730 |
Nájsť tento článok vo Web of Science