GenAI Reliability in Content Analysis: Assessing Agreement Between LLMs in Measuring Discursive Violence
This study investigates the reliability of three leading large language models (LLMs), ChatGPT 4.5, Claude 3.7 Sonnet, and Gemini 2.0 Flash, in measuring discursive violence against women in Eminem's lyrics. Through a three-phase experimental design, we assessed both inter-coder reliability bet...
Gespeichert in:
| Veröffentlicht in: | International Conference on Control Systems and Computer Science (Online) S. 604 - 611 |
|---|---|
| Hauptverfasser: | , , |
| Format: | Tagungsbericht |
| Sprache: | Englisch |
| Veröffentlicht: |
IEEE
27.05.2025
|
| Schlagworte: | |
| ISSN: | 2379-0482 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!