En internet las lenguas más utilizadas son el inglés, el chino y el castellano, en este orden. Millones de usuarios entienden, consultan y consumen contenido en estos idiomas cada día.
Esto genera una contrapartida, y es que existe una gran brecha con los recursos y el contenido digital que hay de las lenguas más pequeñas, como es el caso del catalán.
Estos recursos son los que permiten desarrollar las aplicaciones basadas en la Inteligencia Artificial. Por eso, para que las máquinas hablen catalán, primero se les tiene que enseñar.
Con este objetivo nace Aina, un proyecto que pretende enseñar catalán a la Inteligencia Artificial (IA) gracias a la colaboración ciudadana bajo el lema «La nostra llengua, la teva veu».
A través de la página web del Projecte Aina, los voluntarios pueden ceder su voz leyendo unos fragmentos predeterminados por el programa y registrándolos.
Gracias a esta iniciativa se está creando un diccionario oral en catalán con acentos y registros de todo tipo, que permitirán generar los recursos necesarios para que la IA lo hable.
El proyecto está impulsado por el Govern junto a el Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) y el diccionario oral es solo una parte de él, ya que no solo se necesitan recursos hablados sino también escritos técnicos, como Tesis Doctorales, pero también con lenguaje de uso cotidiano. Eso sí, de momento, los ciudadanos de a pie solo podemos contribuir con nuestra voz.