Acabo de leer que el traductor de Google, el que muchos de nosotros empleamos con el ordenador o con el móvil, ha aumentado en veinticuatro ... idiomas. Entre ellos, sánscrito, quechua, guaraní y aymará. Con las nuevas incorporaciones se llega a 133 lenguas. Siendo esto importante, no es lo que más me ha sorprendido, lo ha sido la técnica empleada, que se llama aprendizaje de tiro cero ('zero-shot').
Hasta ahora, el traductor de Google era una inteligencia artificial (IA) que aprendía a traducir. Para su educación se le mostraban textos en un idioma y su traducción (hecha por humanos). A partir de esos ejemplos la IA aprendía. Para poder hacerlo era necesario que hubiera disponibles gran cantidad de textos y sus traducciones.
En los nuevos idiomas incorporados no se disponía de traducciones. Tan solo tenían textos en el idioma que querían traducir. Es a esa tecnología a la que llaman aprendizaje de tiro cero.
Para entender cómo funciona, imaginemos el siguiente problema, nosotros sabemos el idioma español y somos capaces de identificar y nombrar al burro, pero nunca hemos visto una cebra. En un texto, también en español, encontramos que la cebra es parecida al burro, pero con rayas blancas y negras. Seguro que cuando veamos una cebra por primera vez, no habrá confusión y sabremos identificarla. Eso es lo que han hecho con los nuevos idiomas. Nos advierten que no esperemos una traducción perfecta.
¿Tienes una suscripción? Inicia sesión