GenAI Reliability in Content Analysis: Assessing Agreement Between LLMs in Measuring Discursive Violence

This study investigates the reliability of three leading large language models (LLMs), ChatGPT 4.5, Claude 3.7 Sonnet, and Gemini 2.0 Flash, in measuring discursive violence against women in Eminem's lyrics. Through a three-phase experimental design, we assessed both inter-coder reliability bet...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:International Conference on Control Systems and Computer Science (Online) S. 604 - 611
Hauptverfasser: Rughinis, Cosima, Dascalu, Mihai, Rasnayake, Susantha
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: IEEE 27.05.2025
Schlagworte:
ISSN:2379-0482
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!