Alia, una Inteligencia Artificial generativa entrenada en castellano y en lenguas cooficiales "no es el ChatGPT español ni pretende serlo", es mucho más que una aplicación, es una familia de modelos desarrollada por la Administración, dirigida a otras administraciones, a las pequeñas y medianas empresas y a la investigación científica.
Así lo ha resumido este martes la secretaria de Estado de Digitalización e Inteligencia Artificial, María González Veracruz, en un encuentro con periodistas en el que ha explicado en qué consiste esta iniciativa anunciada el pasado lunes por el presidente del Gobierno, Pedro Sánchez, y cuya construcción ha sido "un ejercicio de eficiencia de pocos recursos pero grandes resultados".
Alia, ha detallado Veracruz, "no es la invención de la rueda, ni pretende serlo" pero es una gran iniciativa, pionera en Europa, abierta y entrenada en castellano y en las lenguas cooficiales del país, y "un laboratorio" que seguirá "en construcción" y que está al servicio de la ciudadanía.
Esta infraestructura pública que ha sido desarrollada gracias a las capacidades del centro de supercomputación Barcelona Supercomputing Center (BSC) y que forma parte de la Estrategia de Inteligencia Artificial 2024, pretende democratizar el acceso a la IA a las administraciones públicas, las empresas y desarrolladores y al mundo de la investigación y, en definitiva, beneficiar a toda la ciudadanía.
Para "el Gobierno era prioritario desarrollar modelos de lenguaje en castellano, que es la cuarta lengua del mundo y la segunda más utilizada en Internet. Alia es la punta de lanza de un proyecto de país que solo está despegando y que esperamos que tenga mucho éxito en el medio y largo plazo", ha subrayado Veracruz.
Valores y Objetivos
Alia es una familia de modelos de lenguaje que proporciona una infraestructura pública de recursos linguísticos en castellano y en lenguas cooficiales que no tiene precedente.
Alia, que cuenta con una web informativa propia (www.alia.gob.es) es un modelo transparente, ya que todos los datos con los que ha sido entrenado están en el 'Alia Kit', disponible a toda la comunidad de código abierto.
Alia ha sido entrenada con datos públicos sobre legislación europea en los 23 idiomas oficiales, datos de patentes médicas, la Constitución Española, intervenciones en las cortes españolas y los parlamentos europeo y autonómicos, consultas tributarias, códigos universitarios públicos, documentos jurídicos oficiales, y todas las publicaciones del BOE, entre otras muchas fuentes.
Además, Alia se ha entrenado casi en un 20 por ciento en castellano y lenguas cooficiales -un porcentaje mucho mayor que el de los modelos comerciales-, si bien, el Gobierno tiene la intención mejorar este porcentaje y especialmente el del euskera, una lengua de la que hay todavía hay pocos 'corpus' (bases de datos).
Los objetivos de Alia son aumentar y mejorar la presencia del castellano en los modelos existentes, fomentar la investigación y el desarrollo en este campo para desarrollar soluciones tecnológicas en nuestro idioma y fomentar una comunidad de IA en España y tejer redes con los países del lenguaje que hablan más de 600 millones de personas en el mundo.
Además, Alia será de gran ayuda para la industria, para que los emprendedores y pymes (más del 90% del tejido empresarial español) puedan competir en igualdad de oportunidades, y ayudar a las administraciones públicas que actualmente ya emplean dos modelos: uno para agilizar el trabajo de la Agencia Tributaria y otro para mejorar el diagnóstico de las insuficiencias cardiacas en la Atención Primaria.
Se ha avanzado que se está trabajando ya para hacer más aplicaciones, en colaboración con los distintos ministerios del Gobierno, atendiendo a sus necesidades.
Y aunque hay iniciativas similares en Europa, como la de Suecia (fue el primer país en hacerlo) y otras en Alemania o Italia, la intención es que Alia se convierta en el estándar de todos los territorios de habla hispana y lusófona.