Una eina per a una llengua en procés d'estandardització: el traductor automàtic català-sard

Hèctor Alòs i Font, Gianfranco Fronteddu, Francis M. Tyers
2018 Linguamática  
Proposta rebuda el 15 d'octubre 2017 i acceptada per a publicació el 3 de desembre 2017. Una eina per a una llengua en procés d'estandardització: el traductor automàtic català-sard Machine translation from Catalan to Sardinian: a translation tool for a language in the process of standardisation Resum Aquest article presenta el desenvolupament d'un sistema de traducció automàtica en codi obert basat en regles del català al sard mitjançant la plataforma Apertium, parant una atenció especial a la
more » ... reació del diccionari bilingüe i de les regles de selecció lèxica i transferència estructural. Es mostren alguns problemes derivats de l'estat actual del sard estàndard. S'ha obtingut una tassa d'error per paraula (WER) del 20,5% i una tassa d'error per paraula independent de la posició (PER) del 13,9%. Mitjançant l'anàlisi qualitativa de la traducció de quatre articles enciclopèdics, s'analitzen les causes d'aquests resultats. Paraules clau sard, català, traducció automàtica, estandardització lingüística, Apertium, RBMT Abstract This article describes the development of a free/open-source rule-based machine translation system for Catalan to Sardinian based on the Apertium platform. Special attention is given to the components of the system related with transfer (structural and lexical) and lexical selection, drawing attention to issues stemming from the current state of the Sardinian written norm. The system has a word-error rate (WER) of 20.5% and a position-independent worderror rate (PER) of 13.9%. We analyse the remaining errors by doing a qualitative analysis of the translation of four articles from the encyclopaedic domain.
doi:10.21814/lm.9.2.255 fatcat:v66y4ixdhrgz3ptnn7vjjifjxu