DeepL et Google Translate face à l'ambiguïté phraséologique

Malgré les progrès de la traduction automatique neuronale, l'intelligence artificielle ne permet toujours pas à la machine de comprendre pour déjouer tous les pièges de la traduction, notamment ceux de l'ambiguïté lexicale, phraséologique, syntaxique et sémantique (Koehn 2020). Deux struct...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:Journal of data mining and digital humanities Ročník Towards robotic translation?; číslo III. Biotranslation vs....
Hlavní autor: Bacquelaine, Françoise
Médium: Journal Article
Jazyk:angličtina
francouzština
Vydáno: INRIA 11.12.2022
Nicolas Turenne
Témata:
ISSN:2416-5999, 2416-5999
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Abstract Malgré les progrès de la traduction automatique neuronale, l'intelligence artificielle ne permet toujours pas à la machine de comprendre pour déjouer tous les pièges de la traduction, notamment ceux de l'ambiguïté lexicale, phraséologique, syntaxique et sémantique (Koehn 2020). Deux structures portugaises moyennement figées présentent les caractéristiques des « unités de construction préformées » (UCP) décrites par Schmale (2013). Elles relèvent donc de la phraséologie au sens large et doivent être traduites en bloc. Les principaux défis de traduction en bloc que lancent ces UCP binaires à la machine résultent, d'une part, de variables simples ou complexes, et, d'autre part, des propriétés syntaxiques de scission et d'inversion des éléments sur l'axe syntagmatique. Un échantillon de 168 occurrences de ces UCP en contexte phrastique a été prélevé sur un corpus journalistique portugais. Cet échantillon a été traduit en français par DeepL et Google Translate en 2019 et en 2021. Les traductions automatiques brutes ont été confrontées à un modèle de biotraduction établi à partir de corpus parallèles ou alignés portugais-français et analysées en fonction de deux critères généraux (non-littéralité et acceptabilité) et de quelques défis spécifiques à chaque UCP. Cette analyse permet d'évaluer l'évolution de ces deux systèmes de traduction automatique face à l'ambiguïté phraséologique et d'en tirer des conclusions quant à la possibilité d'extinction de la biotraduction et aux implications de ces outils performants sur la formation des futurs prestataires de services linguistiques. Mots-clefs traduction automatique neuronale ; post-édition ; levée d'ambiguïté ; unité de construction préformée ; portugais ; français
AbstractList Malgré les progrès de la traduction automatique neuronale, l'intelligence artificielle ne permet toujours pas à la machine de comprendre pour déjouer tous les pièges de la traduction, notamment ceux de l'ambiguïté lexicale, phraséologique, syntaxique et sémantique (Koehn 2020). Deux structures portugaises moyennement figées présentent les caractéristiques des « unités de construction préformées » (UCP) décrites par Schmale (2013). Elles relèvent donc de la phraséologie au sens large et doivent être traduites en bloc. Les principaux défis de traduction en bloc que lancent ces UCP binaires à la machine résultent, d'une part, de variables simples ou complexes, et, d'autre part, des propriétés syntaxiques de scission et d'inversion des éléments sur l'axe syntagmatique. Un échantillon de 168 occurrences de ces UCP en contexte phrastique a été prélevé sur un corpus journalistique portugais. Cet échantillon a été traduit en français par DeepL et Google Translate en 2019 et en 2021. Les traductions automatiques brutes ont été confrontées à un modèle de biotraduction établi à partir de corpus parallèles ou alignés portugais-français et analysées en fonction de deux critères généraux (non-littéralité et acceptabilité) et de quelques défis spécifiques à chaque UCP. Cette analyse permet d'évaluer l'évolution de ces deux systèmes de traduction automatique face à l'ambiguïté phraséologique et d'en tirer des conclusions quant à la possibilité d'extinction de la biotraduction et aux implications de ces outils performants sur la formation des futurs prestataires de services linguistiques. Mots-clefs traduction automatique neuronale ; post-édition ; levée d'ambiguïté ; unité de construction préformée ; portugais ; français
Author Bacquelaine, Françoise
Author_xml – sequence: 1
  givenname: Françoise
  surname: Bacquelaine
  fullname: Bacquelaine, Françoise
  organization: UNIVERSITE DE PORTO PRT
BackLink https://hal.science/hal-03583995$$DView record in HAL
BookMark eNpVkMtKw0AUhgepYK1d-QLZiUjrTOaSmZWUqm0h4Kauh5PMSZqSdmqSCr6N2658iLyYvYjo6hz-859v8V2SztqvkZBrRodChUbfL93KLYaGMX1GuqFgaiCNMZ0_-wXp1_WSUsqk0FLKLnl4RNzEATbBxPu8xGBewbouocEggxSD9jMob2CVFPm2_WraXbBZVFC3O1_6vHjb4hU5z6Cssf8ze-T1-Wk-ng7il8lsPIoHKVOcDwxPUiYVpFpERkSJ5ipyGcfQgREgGFUylKlWGlAahAyy_ZFFgkqnMVSO98jsxHUelnZTFSuoPqyHwh4DX-UWqqZIS7TMIUtCGskkRJEBN4IL5DqkznCnGO5ZtyfWAsp_qOkotoeMcqm5MfKd77t3p25a-bquMPt9YNQetdujdnvQzr8BbLR4Jw
ContentType Journal Article
Copyright Distributed under a Creative Commons Attribution 4.0 International License
Copyright_xml – notice: Distributed under a Creative Commons Attribution 4.0 International License
DBID AAYXX
CITATION
1XC
BXJBU
IHQJB
VOOES
DOA
DOI 10.46298/jdmdh.9118
DatabaseName CrossRef
Hyper Article en Ligne (HAL)
HAL-SHS: Archive ouverte en Sciences de l'Homme et de la Société
HAL-SHS: Archive ouverte en Sciences de l'Homme et de la Société (Open Access)
Hyper Article en Ligne (HAL) (Open Access)
DOAJ Directory of Open Access Journals
DatabaseTitle CrossRef
DatabaseTitleList

CrossRef
Database_xml – sequence: 1
  dbid: DOA
  name: Directory of Open Access Journals
  url: https://www.doaj.org/
  sourceTypes: Open Website
DeliveryMethod fulltext_linktorsrc
Discipline Computer Science
EISSN 2416-5999
ExternalDocumentID oai_doaj_org_article_1de1b2075b2e4fa39434e3820d93d61e
oai:HAL:hal-03583995v3
10_46298_jdmdh_9118
GroupedDBID 5VS
AAFWJ
AAYXX
ADBBV
ADQAK
AFPKN
ALMA_UNASSIGNED_HOLDINGS
BCNDV
CITATION
FRP
GROUPED_DOAJ
KQ8
M~E
OK1
1XC
BXJBU
IHQJB
VOOES
ID FETCH-LOGICAL-c1633-93bc156ac847947b8367df3e2da94a4106525c868ae59eafaff3e17405d8e26d3
IEDL.DBID DOA
ISSN 2416-5999
IngestDate Fri Oct 03 12:32:29 EDT 2025
Tue Oct 14 20:05:10 EDT 2025
Sat Nov 29 04:10:29 EST 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue III. Biotranslation vs....
Language English
French
License Distributed under a Creative Commons Attribution 4.0 International License: http://creativecommons.org/licenses/by/4.0
LinkModel DirectLink
MergedId FETCHMERGED-LOGICAL-c1633-93bc156ac847947b8367df3e2da94a4106525c868ae59eafaff3e17405d8e26d3
OpenAccessLink https://doaj.org/article/1de1b2075b2e4fa39434e3820d93d61e
ParticipantIDs doaj_primary_oai_doaj_org_article_1de1b2075b2e4fa39434e3820d93d61e
hal_primary_oai_HAL_hal_03583995v3
crossref_primary_10_46298_jdmdh_9118
PublicationCentury 2000
PublicationDate 2022-12-11
PublicationDateYYYYMMDD 2022-12-11
PublicationDate_xml – month: 12
  year: 2022
  text: 2022-12-11
  day: 11
PublicationDecade 2020
PublicationTitle Journal of data mining and digital humanities
PublicationYear 2022
Publisher INRIA
Nicolas Turenne
Publisher_xml – name: INRIA
– name: Nicolas Turenne
SSID ssj0001548555
Score 2.1411645
Snippet Malgré les progrès de la traduction automatique neuronale, l'intelligence artificielle ne permet toujours pas à la machine de comprendre pour déjouer tous les...
SourceID doaj
hal
crossref
SourceType Open Website
Open Access Repository
Index Database
SubjectTerms [info.info-ai]computer science [cs]/artificial intelligence [cs.ai]
[info.info-au]computer science [cs]/automatic control engineering
[shs.langue]humanities and social sciences/linguistics
acm: i.: computing methodologies/i.2: artificial intelligence/i.2.7: natural language processing/i.2.7.4: machine translation
Artificial Intelligence
Automatic Control Engineering
Computer Science
Humanities and Social Sciences
Linguistics
Title DeepL et Google Translate face à l'ambiguïté phraséologique
URI https://hal.science/hal-03583995
https://doaj.org/article/1de1b2075b2e4fa39434e3820d93d61e
Volume Towards robotic translation?
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVAON
  databaseName: Directory of Open Access Journals
  customDbUrl:
  eissn: 2416-5999
  dateEnd: 99991231
  omitProxy: false
  ssIdentifier: ssj0001548555
  issn: 2416-5999
  databaseCode: DOA
  dateStart: 20140101
  isFulltext: true
  titleUrlDefault: https://www.doaj.org/
  providerName: Directory of Open Access Journals
– providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  customDbUrl:
  eissn: 2416-5999
  dateEnd: 99991231
  omitProxy: false
  ssIdentifier: ssj0001548555
  issn: 2416-5999
  databaseCode: M~E
  dateStart: 20140101
  isFulltext: true
  titleUrlDefault: https://road.issn.org
  providerName: ISSN International Centre
link http://cvtisr.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrV07T8MwELZQxcDCG1FeshASU6C249SeEG-GghgAsUV-nKGotAgKI7-FlYkf0T_G2WkRnViQogxOlETf5Xz3Wb7vCNnizHsXvMmklpDlNkSf043MCIPJPdfMpk00N63mxYW6vdWXv1p9xT1hlTxwBdwu88Asx8BmOeTBiKhnBgLjltfCFwzi7ItZzy8yVdUHR9ETWRXk5QXXavfBP_r7HfRtNRaCklI_Bpb70UJqCiwns2R6mBHS_epL5sgEdOfJzKjbAh063wLZOwJ4alHo09Ne764DNIWZDuaKNBgHdPBBO9vm0bbvXgdf_cEnRTOZl8Fnmt1w9l8k1yfHV4dn2bD9QeYwSRKZFtYhuzJORRX4plWiaPoggHujc5Mjl5NcOlUoA1KDCSbgRSQYDekV8MKLJVLr9rqwTGjDoFtGIXzHAvIxsBJ9w5oms7kyweV1sjVCpHyqVC5KZAcJuDIBV0bg6uQgovVzS5SmTgNosHJosPIvg9XJJmI99oyz_VYZxxpCqlhq-yZW_uNNq2SKx2IFhgdbI7X-8yusk0n31m-_PG-kHwbP5-_H3zyEx8I
linkProvider Directory of Open Access Journals
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=DeepL+et+Google+Translate+face+%C3%A0+l%27ambigu%C3%AFt%C3%A9+phras%C3%A9ologique&rft.jtitle=Journal+of+data+mining+and+digital+humanities&rft.au=Fran%C3%A7oise+Bacquelaine&rft.date=2022-12-11&rft.pub=Nicolas+Turenne&rft.eissn=2416-5999&rft.volume=Towards+robotic+translation%3F&rft.issue=III.+Biotranslation+vs....&rft_id=info:doi/10.46298%2Fjdmdh.9118&rft.externalDBID=DOA&rft.externalDocID=oai_doaj_org_article_1de1b2075b2e4fa39434e3820d93d61e
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2416-5999&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2416-5999&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2416-5999&client=summon