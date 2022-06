Si vostè, estimat lector, és aficionat a la bona ciència-ficció televisiva o cinematogràfica i està familiaritzat amb la saga Star Trek, sens dubte recordarà un dels gadgets futuristes més icònics de l’univers creat per Gene Roddenberry: el traductor universal.

Aquest inexistent aparell és capaç de traduir un gran nombre de llengües, tant terrestres com de fora del planeta, per a facilitar la comunicació dels humans amb altres espècies. I, fins i tot, d’aprendre llengües només mitjançant unes certes anàlisis.

Una tecnologia similar és la que ha desenvolupat i implementat Google en el seu traductor automàtic, i que li permet aprendre l’idioma i, a partir d’aquí, començar a realitzar traduccions, sense emprar comparatives. És a dir, que al traductor de Google ja no li fa falta una “Pedra de Rosetta”, un text en l’idioma que es vol aprendre i en un altre conegut, sinó que pot treballar amb textos en només un idioma per a aprendre-ho.

Aquesta tecnologia, batejada com Zero-Shot Machine Translation utilitza el machine learning, una forma d’intel·ligència artificial que, en aquest cas concret, permet aprendre a partir de pocs textos escrits disponibles, ja que les poblacions que parlen aquestes llengües no estan molt digitalitzades o despleguen la seva activitat en Internet majoritàriament en altres llengües.

Per a aquests casos, es fa necessari trobar textos que no continguin ingerències d’altres llengües, ni argot col·loquial, i que estiguin escrits amb correcció, la qual cosa és encara més difícil en el cas de llengües amb pocs recursos en línia.

Google també disposa de la tecnologia LangID (identificador de llengua) que li permet identificar automàticament la llengua en la qual està escrit un text. Per a detectar les llengües poc usades, ha necessitat potenciar-ho i entrenar la IA que ho sustenta, encara més.

A partir d’aquí, el model de llengua s’entrena eliminant parts del text que el motor d’inferència ha de reconstruir a mesura que va aprenent. És a dir, és com un exercici de deducció en el qual com més aprèn el sistema, majors possibilitats té de deduir les parts del text que falten.

Fins a 24 llengües s’han afegit al traductor automàtic de Google gràcies a aquesta tecnologia com, per exemple, el Mizo, parlat per una comunitat de 800.000 persones en el nord-est de l’Índia, o el Lingala, amb 45 milions de parlants repartits pel centre d’Àfrica.

Si bé els resultats de l’ús d’aquesta tecnologia són prometedors, no són perfectes, encara que és d’esperar que com qualsevol tecnologia, la Zero-Shot Machine Translation vagi millorant amb el temps, l’ús i el desenvolupament, i acabi per millorar notablement.

