Detección de fiabilidad en noticias en español

Saved in:
Bibliographic Details
Title: Detección de fiabilidad en noticias en español
Authors: Alonso Tejederas, Elena
Contributors: Jiménez Zafra, Salud María, García cumbreras, Miguel Ángel, Universidad de Jaén. Informática
Publisher Information: Universidad de Jaén
Publication Year: 2024
Subject Terms: Tratamiento inteligente de la Información, Intelligent Information Processing, Ciencia de los ordenadores, Computer Science
Time: 1203
Description: Evaluar la fiabilidad del lenguaje utilizado en la redacción de noticias es cada vez más crucial en el panorama actual de los medios digitales. En este trabajo se realiza una investigación para desarrollar un sistema de clasificación automática para determinar la fiabilidad de noticias escritas en español usando Procesamiento del Lenguaje Natural. Para ello, se ha participado en la competición FLARES: FINE-GRAINED LANGUAGE-BASED RELIABILITY DETECTION IN SPANISH NEWS del workshop IberLEF 2024, que tiene como objetivo la detección precisa de la fiabilidad de noticias escritas en español basándose en el lenguaje usado en ellas. Para el desarrollo del sistema, se han probado las tres técnicas de ingeniería de prompts más usadas (zero-shot, few-shot y CoT), empleando modelos generativos como Gemini y ChatGPT para generar las respuestas. El rendimiento del sistema se ha evaluado exhaustivamente mediante un análisis de errores y una matriz de confusión para identificar áreas de mejora. ; Assessing the reliability of the language used in news writing is increasingly crucial in today's digital media landscape. In this work a research is carried out to develop an automatic classification system to determine the reliability of news written in Spanish using Natural Language Processing. For this purpose, we have participated in the FLARES: FINE-GRAINED LANGUAGE-BASED RELIABILITY DETECTION IN SPANISH NEWS competition of the IberLEF 2024 workshop, which aims to accurately detect the reliability of news written in Spanish based on the language used in them. For the development of the system, the three most widely used prompt engineering techniques (zero-shot, few-shot and CoT) have been tested, employing generative models such as Gemini and ChatGPT to generate the responses. The performance of the system has been thoroughly evaluated by means of an error analysis and a confusion matrix to identify areas for improvement.
Document Type: bachelor thesis
File Description: application/pdf
Language: Spanish; Castilian
Relation: https://hdl.handle.net/10953.1/25182
Availability: https://hdl.handle.net/10953.1/25182
Rights: info:eu-repo/semantics/openAccess
Accession Number: edsbas.59B7F9F7
Database: BASE
FullText Text:
  Availability: 0
CustomLinks:
  – Url: https://hdl.handle.net/10953.1/25182#
    Name: EDS - BASE (s4221598)
    Category: fullText
    Text: View record from BASE
  – Url: https://www.webofscience.com/api/gateway?GWVersion=2&SrcApp=EBSCO&SrcAuth=EBSCO&DestApp=WOS&ServiceName=TransferToWoS&DestLinkType=GeneralSearchSummary&Func=Links&author=Tejederas%20A
    Name: ISI
    Category: fullText
    Text: Nájsť tento článok vo Web of Science
    Icon: https://imagesrvr.epnet.com/ls/20docs.gif
    MouseOverText: Nájsť tento článok vo Web of Science
Header DbId: edsbas
DbLabel: BASE
An: edsbas.59B7F9F7
RelevancyScore: 884
AccessLevel: 3
PubType: Dissertation/ Thesis
PubTypeId: dissertation
PreciseRelevancyScore: 884.306396484375
IllustrationInfo
Items – Name: Title
  Label: Title
  Group: Ti
  Data: Detección de fiabilidad en noticias en español
– Name: Author
  Label: Authors
  Group: Au
  Data: <searchLink fieldCode="AR" term="%22Alonso+Tejederas%2C+Elena%22">Alonso Tejederas, Elena</searchLink>
– Name: Author
  Label: Contributors
  Group: Au
  Data: Jiménez Zafra, Salud María<br />García cumbreras, Miguel Ángel<br />Universidad de Jaén. Informática
– Name: Publisher
  Label: Publisher Information
  Group: PubInfo
  Data: Universidad de Jaén
– Name: DatePubCY
  Label: Publication Year
  Group: Date
  Data: 2024
– Name: Subject
  Label: Subject Terms
  Group: Su
  Data: <searchLink fieldCode="DE" term="%22Tratamiento+inteligente+de+la+Información%22">Tratamiento inteligente de la Información</searchLink><br /><searchLink fieldCode="DE" term="%22Intelligent+Information+Processing%22">Intelligent Information Processing</searchLink><br /><searchLink fieldCode="DE" term="%22Ciencia+de+los+ordenadores%22">Ciencia de los ordenadores</searchLink><br /><searchLink fieldCode="DE" term="%22Computer+Science%22">Computer Science</searchLink>
– Name: Subject
  Label: Time
  Group: Su
  Data: 1203
– Name: Abstract
  Label: Description
  Group: Ab
  Data: Evaluar la fiabilidad del lenguaje utilizado en la redacción de noticias es cada vez más crucial en el panorama actual de los medios digitales. En este trabajo se realiza una investigación para desarrollar un sistema de clasificación automática para determinar la fiabilidad de noticias escritas en español usando Procesamiento del Lenguaje Natural. Para ello, se ha participado en la competición FLARES: FINE-GRAINED LANGUAGE-BASED RELIABILITY DETECTION IN SPANISH NEWS del workshop IberLEF 2024, que tiene como objetivo la detección precisa de la fiabilidad de noticias escritas en español basándose en el lenguaje usado en ellas. Para el desarrollo del sistema, se han probado las tres técnicas de ingeniería de prompts más usadas (zero-shot, few-shot y CoT), empleando modelos generativos como Gemini y ChatGPT para generar las respuestas. El rendimiento del sistema se ha evaluado exhaustivamente mediante un análisis de errores y una matriz de confusión para identificar áreas de mejora. ; Assessing the reliability of the language used in news writing is increasingly crucial in today's digital media landscape. In this work a research is carried out to develop an automatic classification system to determine the reliability of news written in Spanish using Natural Language Processing. For this purpose, we have participated in the FLARES: FINE-GRAINED LANGUAGE-BASED RELIABILITY DETECTION IN SPANISH NEWS competition of the IberLEF 2024 workshop, which aims to accurately detect the reliability of news written in Spanish based on the language used in them. For the development of the system, the three most widely used prompt engineering techniques (zero-shot, few-shot and CoT) have been tested, employing generative models such as Gemini and ChatGPT to generate the responses. The performance of the system has been thoroughly evaluated by means of an error analysis and a confusion matrix to identify areas for improvement.
– Name: TypeDocument
  Label: Document Type
  Group: TypDoc
  Data: bachelor thesis
– Name: Format
  Label: File Description
  Group: SrcInfo
  Data: application/pdf
– Name: Language
  Label: Language
  Group: Lang
  Data: Spanish; Castilian
– Name: NoteTitleSource
  Label: Relation
  Group: SrcInfo
  Data: https://hdl.handle.net/10953.1/25182
– Name: URL
  Label: Availability
  Group: URL
  Data: https://hdl.handle.net/10953.1/25182
– Name: Copyright
  Label: Rights
  Group: Cpyrght
  Data: info:eu-repo/semantics/openAccess
– Name: AN
  Label: Accession Number
  Group: ID
  Data: edsbas.59B7F9F7
PLink https://erproxy.cvtisr.sk/sfx/access?url=https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.59B7F9F7
RecordInfo BibRecord:
  BibEntity:
    Languages:
      – Text: Spanish; Castilian
    Subjects:
      – SubjectFull: Tratamiento inteligente de la Información
        Type: general
      – SubjectFull: Intelligent Information Processing
        Type: general
      – SubjectFull: Ciencia de los ordenadores
        Type: general
      – SubjectFull: Computer Science
        Type: general
    Titles:
      – TitleFull: Detección de fiabilidad en noticias en español
        Type: main
  BibRelationships:
    HasContributorRelationships:
      – PersonEntity:
          Name:
            NameFull: Alonso Tejederas, Elena
      – PersonEntity:
          Name:
            NameFull: Jiménez Zafra, Salud María
      – PersonEntity:
          Name:
            NameFull: García cumbreras, Miguel Ángel
      – PersonEntity:
          Name:
            NameFull: Universidad de Jaén. Informática
    IsPartOfRelationships:
      – BibEntity:
          Dates:
            – D: 01
              M: 01
              Type: published
              Y: 2024
          Identifiers:
            – Type: issn-locals
              Value: edsbas
            – Type: issn-locals
              Value: edsbas.oa
ResultId 1