El Govern català, a través de la Secretaria de Polítiques Digitals del Departament d’Empresa i Treball, ha presentat aquest estiu una nova eina basada en models d’aprenentatge profund i d’intel·ligència artificial generativa, desenvolupada com a assistent periodístic per a generar descripcions de fotografies i millorar l’accessibilitat a la informació. Es tracta d’un dels Projectes d’Alt Impacte (PAI) que du a terme el Centre of Innovation for Data tech and Artificial Intelligence (CIDAI) dins de l’Estratègia d’Intel·ligència Artificial de Catalunya, en aquest cas per a donar resposta al repte plantejat per 3Cat per a agilitzar la feina dels seus equips de redacció i reduir el temps de supervisió en tasques rutinàries per part dels professionals de la informació.
La nova eina es va presentar en un acte presidit per la secretària de Polítiques Digitals, Maria Galindo; la presidenta de 3Cat, Rosa Romà; i el director del CIDAI i director científic de l’Àrea Digital d’Eurecat, Joan Mas.
La iniciativa s’alinea també amb el nou impuls de la intel·ligència artificial que promou el Govern català, que recentment ha creat la Direcció General d’Intel·ligència Artificial, Eficiència i Dades a l’Administració. Aquesta nova unitat promourà l’ús de la intel·ligència artificial com a política de país estructural i transversal, i dona resposta a una de les primeres propostes fetes pel comitè d’experts que pilota el procés de reforma de l’Administració i dels serveis públics.
Per a desenvolupar el projecte s’han utilitzat models multimodals d’IA generativa, capaços de resumir un text i, a la vegada, descriure imatges amb un gran nivell de complexitat i detall, més enllà del simple reconeixement d’objectes. El models multimodals d’IA són models d’aprenentatge automàtic que processen i relacionen diferents tipus de dades o modalitats, com ara imatges, vídeo, àudio i text.
Les fonts d’informació utilitzades per a la descripció contextual de les imatges es basen en el cos de la notícia i en la descripció visual de la fotografia, així com en el llibre d’estil de 3Cat. L’eina desenvolupada permet identificar persones, llocs, objectes, esdeveniments i altres detalls rellevants que puguin ser significatius per a la notícia per a millorar la qualitat de les descripcions dels continguts visuals i, per tant, l’accessibilitat a aquesta informació per part dels usuaris, especialment aquelles persones que tenen limitacions visuals.
Sobre els Projectes d’Alt Impacte (PAI) del CIDAI
Els PAI del CIDAI tenen l’objectiu de fomentar l’adopció de solucions innovadores basades en IA apostant per la col·laboració publicoprivada. Els coneixements adquirits amb aquest i tots els PAI que du a terme el CIDAI es comparteixen en obert amb un informe tècnic i es posen a disposició de l’ecosistema.
Eurecat ha liderat el desenvolupament del PAI “Assistència intel·ligent a la descripció contextualitzada de fotos per a notícies”, en el qual ha participat 3Cat com a promotor del repte per a impulsar la cerca de solucions innovadores avançades, mitjançant l’aplicació de tecnologies d’IA capdavanteres. 3Cat s’ha encarregat també de la fase d’avaluació del projecte, en què s’han fet proves amb professionals de les àrees d’Informatius, Accessibilitat, Responsabilitat Social Corporativa (RSC) i Documentació, que han aportat les seves observacions i suggeriments.
Aquest és el segon PAI del CIDAI amb 3Cat. El primer, dedicat a testejar una solució de resum automàtic de notícies, es va presentar l’any passat i va ser premiat per l’associació representant del sector de la indústria digital a escala estatal AMETIC en la categoria R+D+i on AI Award, pel desenvolupament d’eines intel·ligents basades en programari lliure d’IA generativa per al resum automàtic de contingut audiovisual que faciliten la tasca dels professionals de 3Cat.
Per Tecnonews