Con más de 3.000 horas de cortes de voz grabadas en el repositorio digital de Common Voice, el catalán está a punto de superar el inglés como la lengua con más horas grabadas. Quedan solo 200 horas para que el catalán sustituya el inglés en la primera posición. De hecho, el catalán ya era la segunda lengua con más horas grabadas en este proyecto, impulsado por Mozilla Foundation, y este mes también ha superado el ruandés como segunda lengua con más horas validadas. Ahora, la Plataforma per la Llengua ha confirmado que pondrá en marcha una campaña para poder aumentar la recogida de voces en catalán.
Common Voice es una iniciativa digital por recoger datos de voz que están a disposición de todo el mundo y que es posible gracias a las voces de colaboradores voluntarios de todo el mundo o las validaciones de las grabaciones ya hechas. El objetivo es crear un repositorio de cortes de voz de todas las lenguas del planeta y es un conjunto de datos que, todos aquellos que quieran desarrollar y mejorar software de reconocimiento de habla, como por ejemplo robots domésticos o asistentes de voz; pueden descargarse gratuitamente y en licencia CC0.
Mozilla Foundation creó Common Voice el 2017 y, actualmente, ya cuenta con 136 lenguas. Softcatalà se ha encargado de impulsarlo en los territorios de habla catalana y, el 2020, pasó a formar parte del proyecto Aina, una iniciativa de la Generalitat de Cataluña y la Barcelona Supercomputing Center, con la colaboración del Gobierno de las Islas Baleares, que lo hizo crecer de manera significativa.
Una campaña para conseguir más donaciones
La Plataforma per la Llengua se ha propuesto que el catalán logre la primera posición en la lista de lenguas con más horas grabadas y, por eso, impulsará una campaña para conseguir más donaciones de voz. La iniciativa incorporará una fuerte actividad digital con actas presenciales de recogida de voz para poder grabar cortes a aquellas personas que no tienen el mundo digital al alcance. Además, esto permitirá incorporar dialectos, géneros y edades que, de momento, están poco representados a la base de datos como, por ejemplo, la gente mayor.
A pesar de que no se han anunciado más detalles de la campaña, sí que han confirmado que pondrá en marcha el próximo 14 de abril al Palau Blaugrana, mientras tenga lugar el partido de la Euroliga de baloncesto Barça-Valencia, por el cual la Plataforma dispondrá de algunas entradas con descuento para sus socios. El segundo grande acto será durante el partido de liga entre el Barça y el Real Madrid.
