GenAI Reliability in Content Analysis: Assessing Agreement Between LLMs in Measuring Discursive Violence

This study investigates the reliability of three leading large language models (LLMs), ChatGPT 4.5, Claude 3.7 Sonnet, and Gemini 2.0 Flash, in measuring discursive violence against women in Eminem's lyrics. Through a three-phase experimental design, we assessed both inter-coder reliability bet...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:International Conference on Control Systems and Computer Science (Online) s. 604 - 611
Hlavní autoři: Rughinis, Cosima, Dascalu, Mihai, Rasnayake, Susantha
Médium: Konferenční příspěvek
Jazyk:angličtina
Vydáno: IEEE 27.05.2025
Témata:
ISSN:2379-0482
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.