What is wrong with topic modeling? And how to fix it using search-based software engineering

Topic modeling finds human-readable structures in unstructured textual data. A widely used topic modeling technique is Latent Dirichlet allocation. When running on different datasets, LDA suffers from “order effects”, i.e., different topics are generated if the order of training data is shuffled. Su...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Information and software technology Jg. 98; S. 74 - 88
Hauptverfasser: Agrawal, Amritanshu, Fu, Wei, Menzies, Tim
Format: Journal Article
Sprache:Englisch
Veröffentlicht: Elsevier B.V 01.06.2018
Schlagworte:
ISSN:0950-5849, 1873-6025
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!