El Govern ha anunciat que injectarà tres milions d’euros anuals fins el 2026 al projecte de l’assistent virtual català AINA, el que equival a un total de 12 milions d’euros. La iniciativa, liderada pel Barcelona Supercomputing Center (BSC), està creant un banc de veus en català perquè les màquines puguin entendre i parlar la llengua. “El futur del català es juga en aquest camp i hem de ser actius. Volem que el català tingui les mateixes possibilitats al món digital que qualsevol altra llengua”, ha afirmat aquest dilluns el conseller d’Empresa i Treball, Roger Torrent, des del BSC. Per altra banda, el director adjunt del BSC, Josep Martorell ha assegurat que “tenir un pla plurianual d’aquesta durada és una notícia excepcional, ja que dona tranquil·litat a llarg termini i permet retenir l’equip dedicat al projecte”.
“Volem poder dirigir-nos a les màquines amb la nostra llengua i hem d’ensenyar les màquines a entendre i parlar el català”, ha insistit el titular d’Empresa i Treball aquest dilluns en un acte. AINA és un projecte basat en tecnologies de dades i intel·ligència artificial (AI) impulsat pel Govern i el BSC, i obert a col·laboracions, amb l’objectiu d’aconseguir que la tecnologia entengui i parli el català, és a dir, ensenyar la llengua a les màquines, de manera que la ciutadania pugui relacionar-se amb elles i participar plenament en el món digital en català. “L’objectiu d’AINA és ser un eliminador d’excuses. Que mai més cap gran companyia ni petita tingui l’excusa per no incorporar el català al seu catàleg de serveis textuals, d’àudio i visuals”, ha assenyalat el director adjunt del BSC.
La tecnologia en català pot ser una realitat
Per assolir aquest objectiu, el projecte AINA està desenvolupant la infraestructura necessària perquè la inclusió del català a les aplicacions d’IA sigui prou atractiva i viable, tant per a les grans companyies tecnològiques com per a la indústria local, de manera que qualsevol empresa o organització pugui utilitzar els recursos generats per l’AINA, com ara els corpus (conjunts massius de dades) i els models de la llengua catalana, per desenvolupar les seves solucions o serveis específics (traductors, assistents personals, sintetitzadors de veu, classificadors de textos, etc.) en català.
El projecte ha creat ja el “corpus de text” més gran que s’ha fet mai de la llengua catalana. Aquest corpus s’ha obtingut i continua creixent a base de descarregar textos de diferents fonts digitals en català (planes web, arxius, etc.) i processar-los per poder ser utilitzats com a dades d’entrenament per les xarxes neuronals que utilitzen els models de la llengua. “A partir d’ara treballarem amb els corpus escrits per especificar-los en diferents àmbits temàtics com el biomèdic, el legal o el cultural“, ha avançat el director associat del BSC. “Així el sistemes que entrenem per entendre i parlar el català sàpiguen de tot i no estiguin esbiaixats cap a un costat o un altre”, ha conclòs Martorell.