Построение тематических моделей для анализа больших текстовых массивов в лесомелиоративных исследованиях

Uložené v:
Podrobná bibliografia
Názov: Построение тематических моделей для анализа больших текстовых массивов в лесомелиоративных исследованиях
Informácie o vydavateľovi: ООО Цифра, 2025.
Rok vydania: 2025
Predmety: latent Dirichlet distribution, word clouds, Text Mining, защитное лесоразведение, thematic modelling, латентное распределение Дирихле, protective forestry, тематическое моделирование, облака слов, интеллектуальный анализ текстов
Popis: Апробирована методика анализа информационного потенциала корпуса научных публикаций с применением методов тематического моделирования, в частности алгоритма Латентного распределения Дирихле (LDA). Исследование охватило 533 научные статьи и материалы конференций по тематике защитного лесоразведения, опубликованные с 2000 по 2024 год. Анализ проводился с использованием платформы Orange 3.38.0 с надстройкой для интеллектуального анализа текстов.Результаты показали эффективность LDA для выявления скрытых тематических паттернов в области защитного лесоразведения и агролесомелиорации. Оптимальное количество тем (10) было определено на основе показателей лог-перплексии (12772) и тематической согласованности (0,54). Визуализация результатов осуществлялась с помощью облака слов и многомерного шкалирования (MDS), что обеспечило наглядное представление ключевых тем и их взаимосвязей.Исследование демонстрирует потенциал тематического моделирования как инструмента для автоматизации анализа научной литературы, выявления трендов и пробелов в исследованиях, а также для поддержки принятия решений в области экологического управления и устойчивого развития лесных экосистем.
The methodology for analysing the information potential of the corpus of scientific publications was tested using thematic modelling methods, in particular the Latent Dirichlet Distribution Algorithm (LDA). The study covered 533 research articles and conference proceedings on the subject of protective forestry published from 2000 to 2024. The analysis was conducted using the Orange 3.38.0 platform with an extension for text mining.The results showed the effectiveness of LDA for identifying latent thematic patterns in the field of protective forestry and agroforestry. The optimal number of themes (10) was determined based on log-perplexity (12772) and thematic consistency (0.54). The results were visualised using word cloud and multidimensional scaling (MDS), which provided a visual representation of key themes and their relationships.The research demonstrates the potential of topic modelling as a tool to automate the analysis of scientific literature, identify trends and research gaps, and support decision-making in environmental management and sustainable development of forest ecosystems.
Международный научно-исследовательский журнал, Выпуск 8 (158) 2025
Druh dokumentu: Article
Jazyk: Russian
DOI: 10.60797/irj.2025.158.33
Rights: CC BY
Prístupové číslo: edsair.doi...........6be33c52bbe541a1ea33f739b42b10df
Databáza: OpenAIRE
FullText Text:
  Availability: 0
CustomLinks:
  – Url: https://www.webofscience.com/api/gateway?GWVersion=2&SrcApp=EBSCO&SrcAuth=EBSCO&DestApp=WOS&ServiceName=TransferToWoS&DestLinkType=GeneralSearchSummary&Func=Links&author=
    Name: ISI
    Category: fullText
    Text: Nájsť tento článok vo Web of Science
    Icon: https://imagesrvr.epnet.com/ls/20docs.gif
    MouseOverText: Nájsť tento článok vo Web of Science
Header DbId: edsair
DbLabel: OpenAIRE
An: edsair.doi...........6be33c52bbe541a1ea33f739b42b10df
RelevancyScore: 1002
AccessLevel: 3
PubType: Academic Journal
PubTypeId: academicJournal
PreciseRelevancyScore: 1002.21740722656
IllustrationInfo
Items – Name: Title
  Label: Title
  Group: Ti
  Data: Построение тематических моделей для анализа больших текстовых массивов в лесомелиоративных исследованиях
– Name: Publisher
  Label: Publisher Information
  Group: PubInfo
  Data: ООО Цифра, 2025.
– Name: DatePubCY
  Label: Publication Year
  Group: Date
  Data: 2025
– Name: Subject
  Label: Subject Terms
  Group: Su
  Data: <searchLink fieldCode="DE" term="%22latent+Dirichlet+distribution%22">latent Dirichlet distribution</searchLink><br /><searchLink fieldCode="DE" term="%22word+clouds%22">word clouds</searchLink><br /><searchLink fieldCode="DE" term="%22Text+Mining%22">Text Mining</searchLink><br /><searchLink fieldCode="DE" term="%22защитное+лесоразведение%22">защитное лесоразведение</searchLink><br /><searchLink fieldCode="DE" term="%22thematic+modelling%22">thematic modelling</searchLink><br /><searchLink fieldCode="DE" term="%22латентное+распределение+Дирихле%22">латентное распределение Дирихле</searchLink><br /><searchLink fieldCode="DE" term="%22protective+forestry%22">protective forestry</searchLink><br /><searchLink fieldCode="DE" term="%22тематическое+моделирование%22">тематическое моделирование</searchLink><br /><searchLink fieldCode="DE" term="%22облака+слов%22">облака слов</searchLink><br /><searchLink fieldCode="DE" term="%22интеллектуальный+анализ+текстов%22">интеллектуальный анализ текстов</searchLink>
– Name: Abstract
  Label: Description
  Group: Ab
  Data: Апробирована методика анализа информационного потенциала корпуса научных публикаций с применением методов тематического моделирования, в частности алгоритма Латентного распределения Дирихле (LDA). Исследование охватило 533 научные статьи и материалы конференций по тематике защитного лесоразведения, опубликованные с 2000 по 2024 год. Анализ проводился с использованием платформы Orange 3.38.0 с надстройкой для интеллектуального анализа текстов.Результаты показали эффективность LDA для выявления скрытых тематических паттернов в области защитного лесоразведения и агролесомелиорации. Оптимальное количество тем (10) было определено на основе показателей лог-перплексии (12772) и тематической согласованности (0,54). Визуализация результатов осуществлялась с помощью облака слов и многомерного шкалирования (MDS), что обеспечило наглядное представление ключевых тем и их взаимосвязей.Исследование демонстрирует потенциал тематического моделирования как инструмента для автоматизации анализа научной литературы, выявления трендов и пробелов в исследованиях, а также для поддержки принятия решений в области экологического управления и устойчивого развития лесных экосистем.<br />The methodology for analysing the information potential of the corpus of scientific publications was tested using thematic modelling methods, in particular the Latent Dirichlet Distribution Algorithm (LDA). The study covered 533 research articles and conference proceedings on the subject of protective forestry published from 2000 to 2024. The analysis was conducted using the Orange 3.38.0 platform with an extension for text mining.The results showed the effectiveness of LDA for identifying latent thematic patterns in the field of protective forestry and agroforestry. The optimal number of themes (10) was determined based on log-perplexity (12772) and thematic consistency (0.54). The results were visualised using word cloud and multidimensional scaling (MDS), which provided a visual representation of key themes and their relationships.The research demonstrates the potential of topic modelling as a tool to automate the analysis of scientific literature, identify trends and research gaps, and support decision-making in environmental management and sustainable development of forest ecosystems.<br />Международный научно-исследовательский журнал, Выпуск 8 (158) 2025
– Name: TypeDocument
  Label: Document Type
  Group: TypDoc
  Data: Article
– Name: Language
  Label: Language
  Group: Lang
  Data: Russian
– Name: DOI
  Label: DOI
  Group: ID
  Data: 10.60797/irj.2025.158.33
– Name: Copyright
  Label: Rights
  Group: Cpyrght
  Data: CC BY
– Name: AN
  Label: Accession Number
  Group: ID
  Data: edsair.doi...........6be33c52bbe541a1ea33f739b42b10df
PLink https://erproxy.cvtisr.sk/sfx/access?url=https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsair&AN=edsair.doi...........6be33c52bbe541a1ea33f739b42b10df
RecordInfo BibRecord:
  BibEntity:
    Identifiers:
      – Type: doi
        Value: 10.60797/irj.2025.158.33
    Languages:
      – Text: Russian
    Subjects:
      – SubjectFull: latent Dirichlet distribution
        Type: general
      – SubjectFull: word clouds
        Type: general
      – SubjectFull: Text Mining
        Type: general
      – SubjectFull: защитное лесоразведение
        Type: general
      – SubjectFull: thematic modelling
        Type: general
      – SubjectFull: латентное распределение Дирихле
        Type: general
      – SubjectFull: protective forestry
        Type: general
      – SubjectFull: тематическое моделирование
        Type: general
      – SubjectFull: облака слов
        Type: general
      – SubjectFull: интеллектуальный анализ текстов
        Type: general
    Titles:
      – TitleFull: Построение тематических моделей для анализа больших текстовых массивов в лесомелиоративных исследованиях
        Type: main
  BibRelationships:
    IsPartOfRelationships:
      – BibEntity:
          Dates:
            – D: 18
              M: 08
              Type: published
              Y: 2025
          Identifiers:
            – Type: issn-locals
              Value: edsair
ResultId 1