DravidianCodeMix: sentiment analysis and offensive language identification dataset for Dravidian languages in code-mixed text
This paper describes the development of a multilingual, manually annotated dataset for three under-resourced Dravidian languages generated from social media comments. The dataset was annotated for sentiment analysis and offensive language identification for a total of more than 60,000 YouTube commen...
Uloženo v:
| Vydáno v: | Language resources and evaluation Ročník 56; číslo 3; s. 765 - 806 |
|---|---|
| Hlavní autoři: | , , , , , , |
| Médium: | Journal Article |
| Jazyk: | angličtina |
| Vydáno: |
Dordrecht
Springer Netherlands
01.09.2022
Springer Nature B.V |
| Témata: | |
| ISSN: | 1574-020X, 1574-0218 |
| On-line přístup: | Získat plný text |
| Tagy: |
Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
|
Buďte první, kdo okomentuje tento záznam!