Què és la traducció automàtica?
La traducció automàtica (en anglès MT, per Machine Translation) és l’ús de programari intel·ligent capaç de traduir a diversos idiomes grans quantitats de dades. A grans trets, hi ha tres categories principals de traducció automàtica:
Es diu traducció automàtica “genèrica” a una solució pensada per a textos no especialitzats, i es refereix a motors de traducció com el de Google que tradueix text escrit d’un idioma a un altre, però que no està enfocat a cap àrea d’especialització. Aquest tipus de traducció l’utilitzen usuaris personals o empreses per traduir a l’instant textos molt curts. La traducció automàtica genèrica sol contenir més errors gramaticals i sintàctics i és molt menys precisa que la traducció automàtica “a mida”.
La traducció automàtica “a mida” requereix que el programari de traducció sigui “entrenat” o adaptat per reconèixer expressions pròpies d’un camp, indústria o empresa específica. Per mitjà d’estadístiques bàsiques o de tecnologies de traducció basades en regles, la traducció automàtica “a mida” ofereix a les empreses un alt nivell de precisió amb un volum alt. No obstant això, fins i tot en els casos en què aquests motors van units a un processament previ de dades i a una interfície d’usuari amigable, la qualitat de la traducció es pot veure compromesa per les limitacions pròpies de la tecnologia de traducció emprada.
La traducció automàtica “corporativa” sembla ser la pròxima generació de motors de traducció automàtica “augmentada”. Fan servir una sofisticada tecnologia que reprodueix l’estil, el format i la terminologia de forma més fidel que altres solucions. La traducció automàtica “corporativa” respon a les necessitats dels actuals negocis internacionals, com un gran volum i una alta velocitat en la localització i en les comunicacions multilingües en temps real.
Traducció Automàtica: ¿”General”, “A mida” o “Corporativa”? Si bé les tres categories descrites poden emprar motors basats en estadístiques, hi ha importants diferències de rendiment. Els motors de traducció automàtica “genèrica” incorporen quantitats ingents de dades amb l’esperança que amb el temps millori la qualitat. No disposen de tecnologies que aportin a les traduccions subtileses sintàctiques o estilístiques del llenguatge corporatiu de l’empresa. Les solucions fetes “a mida”, que “ensenyen” o “alimenten” als motors, ofereixen traduccions de millor qualitat i aquesta depèn directament de la qualitat de les dades incorporades. També presenten limitacions degudes a l’efecte de “dilució de dades” i a la tecnologia de traducció automàtica emprada.
Si les comparem, la traducció automàtica “corporativa”, gràcies a aquestes tecnologies augmentades, està dissenyada per a superar algunes limitacions dels motors basats en estadístiques, com són els problemes de format o d’adequació al manual d’estil que fa servir l’empresa.
Quins són els principals tipus de traducció automàtica?
Els sistemes de traducció automàtica basada en regles fan servir una sèrie de regles desenvolupades manualment per experts que reflecteixen en l’idioma de destí les estructures de l’idioma d’origen. El factor humà en els sistemes basats en regles ajuda a oferir traduccions automàtiques força bones amb resultats predictibles. No obstant això, aquest costós treball manual fa que els sistemes basats en regles siguin molt cars i molt complexos d’implantar i mantenir. A mesura que s’afegeixen regles i s’actualitzen, aquests sistemes corren el perill de generar ambigüitats i que la qualitat de les seves traduccions empitjori.
Els sistemes de traducció automàtica estadística utilitzen algoritmes informàtics per produir la millor traducció estadísticament possible a partir de milions de combinacions. Els models estadístics estan formats per paraules i frases apreses automàticament a partir de segments bilingües amb què es creen bases de dades bilingües de traduccions. L’atractiu dels sistemes estadístics resideix en el nivell d’automatització, ja que es generen nous motors en què s’aprofita la seva capacitat d’aprenentatge. El resultat són uns temps de resposta ràpids i un baix cost per a la implantació i gestió d’aquests models estadístics. El major inconvenient d’aquest tipus de motors és l’efecte de “dilució de dades” provocat per l’escassetat de dades que “alimentin” o “entrenin” uns sistemes basats en dades.
Traducció automàtica híbrida. Per abordar les limitacions de qualitat i terminis de comercialització, molts desenvolupadors de motors basats en regles estan millorant la seva tecnologia combinant-la amb traducció automàtica estadística, i han creat solucions híbrides. Els sistemes híbrids ofereixen considerables millores de qualitat, però els costos dels sistemes basats en regles són cars. A això s’afegeix la complexitat de combinar ambdós sistemes.
La nova generació. Els nous motors de traducció automàtica “augmentada” estan millorant les possibilitats de la traducció automàtica estadística i superant les seves limitacions. Aquestes noves solucions de traducció automàtica estadística introdueixen sofisticats sistemes de pre-processament de dades (transformació del llenguatge), tecnologies d’optimització de l’idioma i solucions de gestió terminològica. Aquest tipus de motors volen incorporar les millores de qualitat pròpies dels sistemes híbrids.
A qui està destinada la traducció automàtica?
Avui dia la traducció automàtica s’està estenent entre usuaris i empreses. Molts consumidors la utilitzen per obtenir traduccions instantànies, i les grans multinacionals la incorporen per comunicar-se amb clients i empleats ubicats arreu del món. La veritat és que la traducció automàtica és realment d’utilitat per a grans empreses multinacionals que necessiten traduir quantitats realment grans de contingut, com manuals d’usuari i complexes pàgines web multilingües que actualitzen el seu contingut contínuament. Les grans corporacions que inicien una fase de localització utilitzen la traducció automàtica per localitzar periòdicament el seu contingut a diversos idiomes. Altres empreses que ofereixen ajuda i suport a l’usuari a través de xats o de webs de xarxes socials, utilitzen la traducció automàtica per oferir una experiència d’usuari més personalitzada. La traducció automàtica també la fan servir algunes agències de traducció, sempre combinada amb una fase posterior de correcció i edició per traductors humans.
És la traducció automàtica “prou bona”?
En realitat ens hauríem de preguntar, ¿bastant bona per a què? En la majoria de casos, i si la qualitat de la traducció automàtica és prou bona, es requerirà una fase de post-edició per un traductor humà. Per exemple, si el contingut ha de ser publicat és imprescindible que el resultat de la traducció automàtica sigui revisat i editat per un humà. En altres casos, com en les comunicacions en temps real i en traduccions que necessitem per fer-nos una idea de què s’està parlant, una traducció automàtica “que s’entengui” serà prou bona, i no hi haurà temps ni mitjans perquè un humà editi aquesta traducció.
La traducció automàtica “corporativa”, enfocada a grans corporacions amb un llenguatge més o menys controlat i un manual d’estil predefinit, és capaç de produir traduccions automàtiques de prou qualitat en què el factor humà pot arribar a ser mínim, millorant així la relació cost-eficàcia. Les tecnologies de traducció automàtica “augmentada” són capaces de produir traduccions específiques per a una empresa, un mercat i una marca concreta. Per a això s’utilitza la traducció automàtica basada en regles i estadístiques, alineant grans volums de traduccions i material traduït per la mateixa empresa. Evidentment, l’ús d’aquests motors de traducció no és barat.