Возможности семантического анализа ключевых биграмм для исследования дискурса соседского онлайн сообщества

В статье представлены возможности применения семантического анализа текста для исследования дискурса соседских онлайн сообществ. Дискурс, рождаемый онлайн соседскими сообществами в рамках общего паблика, является смысловым полем, в котором отражаются нарративы о повседневной жизни, истории о среде п...

Full description

Saved in:
Bibliographic Details
Published in:International journal of open information technologies Vol. 9; no. 12
Main Authors: Ненько, А.Е., Недосека, Е.В., Галактионова, А.А.
Format: Journal Article
Language:Russian
Published: 06.04.2022
ISSN:2307-8162, 2307-8162
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Abstract В статье представлены возможности применения семантического анализа текста для исследования дискурса соседских онлайн сообществ. Дискурс, рождаемый онлайн соседскими сообществами в рамках общего паблика, является смысловым полем, в котором отражаются нарративы о повседневной жизни, истории о среде проживания, формах взаимодействия между соседями, а также происходит концептуализация отличительных особенностей среды. С помощью автоматизированного семантического анализа, дополненного качественным анализом текста, были выявлены ключевые и интенсивно обсуждаемые концепты соседского паблика центральной части Санкт-Петербурга “Пять Углов”, которые отражают особенности среды проживания. Данные текстового корпуса паблика были собраны автоматизированным путем с помощью библиотек сетевого скраппинга Scrapy и Selenium в языке программирования Python. Исследование семантического поля ключевых концептов осуществлялось методом биграмм (устойчивых сочетаний) слов, находящихся в непосредственной связи друг с другом в тексте. Предлагаемый подход продемонстрирован на примере анализа биграмм ключевого концепта “улица”. По результатам анализа были выделены четыре измерения, которые связаны с ментальной репрезентацией улицы в представлении анализируемого соседского сообщества: а) улицы - топонимы, названия улиц, которые актуализированы в дискурсе данного сообщества и отражают действительно существующие на данной территории фрагменты городской среды; б) проблемные вопросы, связанные с организацией уличной жизни; в) ценностные характеристики улицы; г) ментальная репрезентация пространственной структуры улицы. The article presents the possibilities of semantic text analysis in studying the discourse of neighboring online communities. The discourse generated online by such a community in a social media group is a semantic field that contains narratives about everyday life, habitat, interaction between neighbors, as well as conceptualizes the distinctive features of the urban environment. With the help of an automated semantic analysis supplemented by a qualitative analysis of the text, the key intensively discussed concepts of the «Pyat’ Uglov (Five Corners)» neighboring community located in the central part of St. Petersburg were identified. The text corpus of the community online discussions was collected with Scrapy and Selenium libraries of Python programming language. The semantic fields of the key concepts were studied with the method of bigrams (stable combinations) of words that are in direct connection with each other in the text. The proposed approach is demonstrated with analysis of the key concept “street” and its bigrams. Based on the results of the analysis, four dimensions, associated with the community’ mental representation of the street, were identified: a) streets - toponyms, or street names pronounced in the discourse of the community, which reflect the actually existing fragments of the urban environment; b) problematic issues related to the organization of street life; c) value characteristics of the street; d) the mental representation of the spatial structure of the street.
AbstractList В статье представлены возможности применения семантического анализа текста для исследования дискурса соседских онлайн сообществ. Дискурс, рождаемый онлайн соседскими сообществами в рамках общего паблика, является смысловым полем, в котором отражаются нарративы о повседневной жизни, истории о среде проживания, формах взаимодействия между соседями, а также происходит концептуализация отличительных особенностей среды. С помощью автоматизированного семантического анализа, дополненного качественным анализом текста, были выявлены ключевые и интенсивно обсуждаемые концепты соседского паблика центральной части Санкт-Петербурга “Пять Углов”, которые отражают особенности среды проживания. Данные текстового корпуса паблика были собраны автоматизированным путем с помощью библиотек сетевого скраппинга Scrapy и Selenium в языке программирования Python. Исследование семантического поля ключевых концептов осуществлялось методом биграмм (устойчивых сочетаний) слов, находящихся в непосредственной связи друг с другом в тексте. Предлагаемый подход продемонстрирован на примере анализа биграмм ключевого концепта “улица”. По результатам анализа были выделены четыре измерения, которые связаны с ментальной репрезентацией улицы в представлении анализируемого соседского сообщества: а) улицы - топонимы, названия улиц, которые актуализированы в дискурсе данного сообщества и отражают действительно существующие на данной территории фрагменты городской среды; б) проблемные вопросы, связанные с организацией уличной жизни; в) ценностные характеристики улицы; г) ментальная репрезентация пространственной структуры улицы. The article presents the possibilities of semantic text analysis in studying the discourse of neighboring online communities. The discourse generated online by such a community in a social media group is a semantic field that contains narratives about everyday life, habitat, interaction between neighbors, as well as conceptualizes the distinctive features of the urban environment. With the help of an automated semantic analysis supplemented by a qualitative analysis of the text, the key intensively discussed concepts of the «Pyat’ Uglov (Five Corners)» neighboring community located in the central part of St. Petersburg were identified. The text corpus of the community online discussions was collected with Scrapy and Selenium libraries of Python programming language. The semantic fields of the key concepts were studied with the method of bigrams (stable combinations) of words that are in direct connection with each other in the text. The proposed approach is demonstrated with analysis of the key concept “street” and its bigrams. Based on the results of the analysis, four dimensions, associated with the community’ mental representation of the street, were identified: a) streets - toponyms, or street names pronounced in the discourse of the community, which reflect the actually existing fragments of the urban environment; b) problematic issues related to the organization of street life; c) value characteristics of the street; d) the mental representation of the spatial structure of the street.
Author Ненько, А.Е.
Недосека, Е.В.
Галактионова, А.А.
Author_xml – sequence: 1
  givenname: А.Е.
  surname: Ненько
  fullname: Ненько, А.Е.
– sequence: 2
  givenname: Е.В.
  surname: Недосека
  fullname: Недосека, Е.В.
– sequence: 3
  givenname: А.А.
  surname: Галактионова
  fullname: Галактионова, А.А.
BookMark eNpNUclKA0EQbURBjfmHucuMXbPPUYJLRMwlnptZOqC4MXPyZhQRERT8ksQkGjPJfICn6j-yOhEJTXV113v1qqjaZKtX11eSsW3glu15XrTTPDlqNduW7fDADMG3LR5ZNrcBbAsATIBwhW38o6tL73VWL4pzzjk4LkSOu8F-8B0r_MIp3Z84w0p11T2ODdXFEQV7ONNf9YQjikyINMDK0GGyEseU2TMoXqpXzcEP9aIeDewTMlB3xJni1MAh4W8GyXRJpCTakIQ-5ipjDQw1hBP1oO7I93Txat7AcLloRfSSkr5xNmfQ6atn3Ri1SGpbbK0TXxSy_udr7HR_r904NI9bB83G7rGZgg2hmToQJ9Ijy5zETzoZRH4cpjRayXkWJ4nruSBTmXE_znjE3cBPpRsEjgyiTmxHTo01Frppfl0UueyIm_zsMs5vBXAx35BYbEjouQs9d8EjsdiQoA2Rhc4vryvR7g
ContentType Journal Article
DBID AAYXX
CITATION
DOI 10.25559/INJOIT.2307-8162.09.202112.111-118
DatabaseName CrossRef
DatabaseTitle CrossRef
DatabaseTitleList CrossRef
DeliveryMethod fulltext_linktorsrc
Discipline Engineering
EISSN 2307-8162
ExternalDocumentID 10_25559_INJOIT_2307_8162_09_202112_111_118
GroupedDBID 5VS
AAYXX
ADBBV
ALMA_UNASSIGNED_HOLDINGS
BCNDV
CITATION
GROUPED_DOAJ
KQ8
M~E
OK1
RNS
ID FETCH-LOGICAL-c1218-c31abe5abed3b6bfd196a8c255e00dabb4541eced06ad090476ce4773e79fa293
ISSN 2307-8162
IngestDate Sat Nov 29 05:33:56 EST 2025
IsDoiOpenAccess false
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue 12
Language Russian
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-c1218-c31abe5abed3b6bfd196a8c255e00dabb4541eced06ad090476ce4773e79fa293
OpenAccessLink https://doi.org/10.25559/injoit.2307-8162.09.202112.111-118
ParticipantIDs crossref_primary_10_25559_INJOIT_2307_8162_09_202112_111_118
PublicationCentury 2000
PublicationDate 2022-04-06
PublicationDateYYYYMMDD 2022-04-06
PublicationDate_xml – month: 04
  year: 2022
  text: 2022-04-06
  day: 06
PublicationDecade 2020
PublicationTitle International journal of open information technologies
PublicationYear 2022
SSID ssj0001341934
Score 2.1777017
Snippet В статье представлены возможности применения семантического анализа текста для исследования дискурса соседских онлайн сообществ. Дискурс, рождаемый онлайн...
SourceID crossref
SourceType Index Database
Title Возможности семантического анализа ключевых биграмм для исследования дискурса соседского онлайн сообщества
Volume 9
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  customDbUrl:
  eissn: 2307-8162
  dateEnd: 99991231
  omitProxy: false
  ssIdentifier: ssj0001341934
  issn: 2307-8162
  databaseCode: M~E
  dateStart: 20130101
  isFulltext: true
  titleUrlDefault: https://road.issn.org
  providerName: ISSN International Centre
link http://cvtisr.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwtV3da9RAEF9qK6IP4id-kwf7dOTcfCfgS-96xQpWHyr0LeRjDwQ5y9mWPkmriIig4F9yba969tr7A3za_EfO7ibp5Npii0jJ3N7s7G9ndvaSmXSzIeRhEsNlKXap7kdxCgmK4-uRwUSqYlCfMZumRipfNuEtLPhLS8GLianyWZi1116n46-vB8v_1dXAA2eLR2fP4O4SFBhQBqcDBbcDPZXjp2fpdGAK2mhJ6knaRBxX0tmCY0A4Kalq5dcKFnxxUGNaNDsUlWWvkCxbzaDOLFWuVSHKcqMAKjWlNYTRkKitaj9ATclRtY5qYCAkS1ZQ1I8yoalEbYQ9V0OmGMiIBurORgaZRyzxMZBdhVOWQLlUqeRTPNCtI4Nun2ZAW0iNBlIsUPyxHkqq7AyqjivdmluIE5fqnWO034h4_Vot335XnktWin_WoOWpck7OItvUJGpWbDOVcwJalx9O_cTW9gkjNpMPQIHkKCSzimQdmX0Uuamc2GODW_X9mK60ju-emaZcdOUeXmTFcxC6b-QRATuGl0cJAT4ZmscFH5CcO2Lz3vmFp8_nF-slithHGbqGxEbEJ7qRxxuVrd_HQrJyoSyk6BI2VKChAA0FaEiDUIGKHB4O_xyZMj0nEMtan71D95nFho1ycU2p0AVSK9R99HdlUcCOIu_FK-RynjJrM-pUd5VMdFevkUtoI9Xr5Df_zkf8J98H-oMf8FG2mb3nAy3b5LvA7PED8TX7xHeBswdCO3ykCTYcQz6Alj0N-MPsq5Dh29mX7KPGt6BmJ9sAmX2-r_E-1H_TAGYTQIYg1gegbYkyEBV9UcX3sg_ZBnz2ROcjqUAfdzoC8SE0-sUPpAT8bWWfhWKgIqDdIC_nWovNJ3r-lho9MSA_0hPLiGLmwJHCRS9upxDTRH4Cw8soTaM4th3bYAlLqRulNKC25ybM9jyLeUE7gmzrJpnsvOmwW0SzUpaK_SxpYho2ZW0IiSI3hYTXMmzHdNu3yePCFeGy2owoPMMMufNvze-Si4e_oHtkcqW7yu6T88nayqu33Qdy1v0B5kZhLg
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%D0%92%D0%BE%D0%B7%D0%BC%D0%BE%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D0%B8+%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B3%D0%BE+%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0+%D0%BA%D0%BB%D1%8E%D1%87%D0%B5%D0%B2%D1%8B%D1%85+%D0%B1%D0%B8%D0%B3%D1%80%D0%B0%D0%BC%D0%BC+%D0%B4%D0%BB%D1%8F+%D0%B8%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F+%D0%B4%D0%B8%D1%81%D0%BA%D1%83%D1%80%D1%81%D0%B0+%D1%81%D0%BE%D1%81%D0%B5%D0%B4%D1%81%D0%BA%D0%BE%D0%B3%D0%BE+%D0%BE%D0%BD%D0%BB%D0%B0%D0%B9%D0%BD+%D1%81%D0%BE%D0%BE%D0%B1%D1%89%D0%B5%D1%81%D1%82%D0%B2%D0%B0&rft.jtitle=International+journal+of+open+information+technologies&rft.au=%D0%9D%D0%B5%D0%BD%D1%8C%D0%BA%D0%BE%2C+%D0%90.%D0%95.&rft.au=%D0%9D%D0%B5%D0%B4%D0%BE%D1%81%D0%B5%D0%BA%D0%B0%2C+%D0%95.%D0%92.&rft.au=%D0%93%D0%B0%D0%BB%D0%B0%D0%BA%D1%82%D0%B8%D0%BE%D0%BD%D0%BE%D0%B2%D0%B0%2C+%D0%90.%D0%90.&rft.date=2022-04-06&rft.issn=2307-8162&rft.eissn=2307-8162&rft.volume=9&rft.issue=12&rft_id=info:doi/10.25559%2FINJOIT.2307-8162.09.202112.111-118&rft.externalDBID=n%2Fa&rft.externalDocID=10_25559_INJOIT_2307_8162_09_202112_111_118
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2307-8162&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2307-8162&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2307-8162&client=summon