Neix el Projecte Araina per impulsar que les noves tecnologies parlin i entenguin l’aranès
El 17 de desembre tindrà lloc a Vielha la primera marató de veus per enregistrar veus de parlants de l’aranès
L’objectiu del Projecte Araina és crear un corpus de veu en aranès, imprescindible per desenvolupar tecnologies de la parla
Ara com ara no és possible que les màquines parlin o entenguin aranès. Perquè això sigui possible es necessita una base de dades amb centenars de gravacions de veus en aquesta llengua. Per posar-hi remei, la cooperativa Col·lectivaT especialitzada en tecnologies per a llengües minoritzades, engega el Projecte Araina, votzes en aranés per promoure la creació del primer corpus de veu en aranès a partir de la participació col·lectiva.
L’objectiu del Projecte Araina és contribuir a la supervivència de l’aranès mitjançant la creació d’un corpus de parla en aquesta varietat occitana. El reconeixement automàtic de veu és un component necessari en el desenvolupament d’assistents basats en intel·ligència artificial i necessita centenars d’hores de dades de parla de moltes persones parlants. Aquesta és una tasca molt costosa fins i tot per a idiomes amb recursos elevats.
Marató de veus a Vielha: cap a un corpus de parla en aranès impulsat per la comunitat
Per començar a recollir hores de veu en aranès, s’ha organitzat la primera marató de veus per enregistrar la veu de persones de parla aranesa de diverses edats, registres i parlars. L’esdeveniment se celebrarà el 17 de desembre a la sala Antara de l’Ajuntament de Vielha e Mijaran (c/ Arnals, 7) de 10 a 14h i reunirà les primeres persones voluntàries que estiguin disposades a donar la seva veu. També hi haurà l’opció de participar-hi de forma virtual durant tot el cap de setmana.
Les persones voluntàries hauran de llegir diversos fragments de text projectats a la seva pantalla mentre es graven. Els textos introduïts per fer l’exercici són de les obres literàries clàssiques traduïdes a l’aranès per Antòni Nogués. Tot aquest procés es realitza a través de la plataforma oberta Common Voice de Mozilla tal com s’està fent amb el Projecte Aina que ja porta més de 2.500 hores de veus recollides en català.
Roda de premsa de Presentació del Projecte Araina, votzes en aranés
Per donar a conèixer el Projecte Araina i el seu camp de treball, es farà una roda de premsa amb les persones responsables del projecte.
Dia i hora: 17 de desembre a les 11.30h
Lloc: Conselh Generau d’Aran (passeg dera Libertat, 16, Vielha)
Bretxa tecnològica i desenvolupament de tecnologies de la parla
En el cas de les llengües majoritàries, el procés de generació dels prototips i el desenvolupament de les tecnologies de la parla és relativament senzill gràcies a l’existència dels serveis proporcionats per les empreses tecnològiques. En canvi, és difícil trobar solucions per a les llengües minoritzades com l’aranès. Aquesta és una de les conseqüències de la bretxa tecnològica entre les llengües amb recursos suficients i les llengües amb menys recursos, cosa que agreuja encara més el perill d’extinció digital de les segones.
Sobre el Projecte Araina i Col·lectivaT
El Projecte Araina està impulsat per la cooperativa Col·lectivaT amb la col·laboració de l’investigador de la Universitat de Lleida Jordi Suïls Subirà i de la investigadora Helena Torres Purroy, membres del Conselh Consultatiu der Aranés. Està subvencionat pel Departament de Cultura de la Generalitat de Catalunya en el marc de les “Subvencions per promoure el coneixement i l’ús de l’occità, aranès a l’Aran, a Catalunya” i rep el suport del Conselh Generau d’Aran, Lo Congrès permanent de la lenga occitana i la fundació Mozilla.
Col·lectivaT és una cooperativa sense ànim de lucre que promou el coneixement obert i el diàleg entre diferents realitats, mitjançant la investigació social i la prestació de serveis lingüístics i tecnològics. Dins d’aquest últim àmbit, una de les seves tasques centrals és el desenvolupament de tecnologies innovadores al servei de llengües minoritzades. En aquest sentit, han desenvolupat el primer sintetitzador de veu basat en xarxes neuronals en català, el Catotron, i segueixen col·laborant per la digitalització de llengües com l’amazic, el judeo-castellà i el gallec.
[ Valora aquesta informació fent clic als estels ]
Si t'agrada aquest canal informatiu subscriu-te al RSS !
NOTA: El comptador de visites està actiu des de 02-2016