Definitivamente, Euskadi se ha subido a la ola de la Inteligencia Artificial (IA) en una de sus muchas aplicaciones como es el de las tecnologías ... del lenguaje. Lo que parecían recursos de comunicación más propios del futuro y de países anglosajones, son presente y se elaboran aquí, entre investigadores de la EHU y las empresas del sector. El conocimiento científico de los unos y las necesidades creativas de los otros convergen en un ecosistema pionero en el Estado y referente en Europa. Tanto es así que el Ministerio de Transformación Digital hizo una convocatoria para promover una cátedra que investigara y formara en esta disciplina y se ha quedado aquí.

Se presentó ayer oficialmente, aunque lleva un año funcionando con el trabajo en común de cuatro grupos de investigación de la EHU, la empresa fundadora Avature y las entidades colaboradoras Orai NLP, Ikerlan, Euskaltel/MasOrange, Multiverse y Tecnalia. Su director, Aitor Soroa, explica que la función es «ser agente dinámico en los ámbitos de investigación, transferencia con la industria, formación específica y difusión a la sociedad». Perciben su relevancia las instituciones, no en vano participaron en el acto de ayer –en el Palacio Miramar de San Sebastián – el rector de la EHU, Joxerramon Bengoetxea; la secretaria de Estado de Digitalización e Inteligencia Artificial, María González Veracruz; el consejero de Ciencia, Universidades e Innovación del Gobierno Vasco, Juan Ignacio Pérez Iglesias; y la diputada general de Gipuzkoa, Eider Mendoza.

Según Aitor Soroa, «la reflexión que hacíamos era que esta área de las tecnologías del lenguaje es donde más ha avanzado la IA, y ahí estamos viviendo cambios vertiginosos, lo cual tiene beneficios pero también riesgos. Uno de ellos es que el tejido industrial quede relegado y coja tecnología de las grandes corporaciones para trasladarla al cliente sin aportarle valor añadido, de manera que la agenda la marquen las grandes tecnológicas».

El espacio de colaboración de Hitz propone un punto de encuentro «entre empresas y academia, porque se puede crear un círculo virtuoso en el que, por un lado, las empresas pueden influir en la academia en lo que quieren que se investigue y, por otro lado, la investigación puntera se puede trasladar rápidamente a las empresas en forma de producto y servicio».

La finalidad práctica emerge en la razón de ser de la cátedra, dado que, tal y como subraya Soroa «en esta área investigación y producto están muy unidos, mucho más cerca que en otros sectores. Los modelos de lenguaje son muy cercanos. Y por eso, esta comunicación entre empresa y academia resulta necesaria para hacer un polo que pueda liderar este tipo de tecnologías aquí, en el Estado y en Europa».

La cátedra Hitz, la primera del Estado especializada en IA y Tecnología del Lenguaje, forma parte del programa Cátedras ENIA, impulsado por el Ministerio para la Transformación Digital y de la Función Pública, en el marco de la Estrategia Nacional de Inteligencia Artificial (ENIA), que aporta a la iniciativa una ayuda de 600.000 euros, con fondos europeos del Plan de Recuperación, Transformación y Resiliencia. La secretaria de Estado de Digitalización e Inteligencia Artificial, María González Veracruz, aseguró ayer que esta cátedra «sitúa a Euskadi, una vez más, como referencia clave en una revolución como la que prepara la inteligencia artificial». En este sentido, subrayó la importancia de este trabajo «para garantizar, desde la diversidad y la pluralidad, que la IA se construye al nivel de los humanos, a nuestro servicio, y con capacidad para entendernos».

Corpus digital en euskera

González Veracruz informó de que España ha autorizado la firma de un convenio con el Gobierno Vasco para impulsar la creación de un corpus digital en euskera a disposición de las empresas y la sociedad. Son 5 millones de euros con los que se podrán generar corpus lingüísticos «para entrenar modelos de lenguaje, imprescindibles para el reconocimiento y síntesis de habla, traductores u otras aplicaciones de sectores como la salud», explicó.

Soroa reconocería, en ese sentido, que «uno de los riesgos en este tipo de tecnologías está precisamente en la diversidad lingüística y cultural. Nosotros hemos hecho muchos trabajos con el euskera y otras lenguas, y eso nos ha puesto en una buena posición para liderar esta cátedra».

La formación será uno de los pilares del proyecto, según Soroa. «La cátedra ofrece cursos de formación continua tanto para gente que ha estudiado grado de IA en la facultad de Informática de la EHU como para gente de la empresa a modo de reciclaje, en una área en la que pensamos que hace falta gente especializada y formada».

El aspecto diferencial de esta cátedra, con respecto a otras en IA, es el enfoque particular en las tecnologías de la lengua, que permiten construir modelos que entienden el lenguaje humano, ya sea el texto o voz. Ejemplos de estos modelos son: ChatGPT, Gemini o el propio modelo Latxa desarrollado por el Centro HiTZ.

La cátedra inaugurada ayer con todos los honores pone a Euskadi en el mapa internacional de las tecnologías del lenguaje mientras afronta los principales desafíos del sector: la dependencia tecnológica de grandes compañías, la necesidad de cómputo –el entrenamiento de estos modelos de IA requiere un alto poder computacional–, la escasez de profesionales formados y el riesgo de marginar lenguas pequeñas y culturas diversas, al estar centrados mayormente en idiomas como el inglés.