Mércores, 19 Jun. 2019

Actualizado12:21:09 AM GMT

Estás en Canais Ciencia e tecnoloxía Tecnoloxía O galego, o eúscaro e o catalán están en perigo de extinción dixital

O galego, o eúscaro e o catalán están en perigo de extinción dixital

Correo-e Imprimir PDF
A dixitalización de gran cantidade de textos é esencial para as tecnoloxías da linguaxe / david__jones

A rede europea META-NET alerta fronte ao perigo que supón para as linguas minoritarias a falta de adaptación tecnolóxica á sociedade da información.

As novas tecnoloxías proporcionaron novos espazos para a expresión de culturas minoritarias, pero a súa capacidade "homoxeneizadora" tamén pon en perigo a diversidade. Sobre este risco alerta o último informe de META-NET , unha rede europea formada por 60 centros de investigación de 34 países creada para axudar a pór os cimentos tecnolóxicos dunha sociedade da información europea multilingüe.

Segundo esta serie de 31 libros brancos, que se presentan mañá, Día Europeo das Linguas, 21 dos 30 idiomas europeos analizados están en perigo de extinción dixital. Isto incluiría ao galego, o eúscaro e o catalán, que non contan coas ferramentas automáticas de tradución, procesado de textos ou recoñecemento de voz o suficientemente desenvolvidos como para manter unha presenza significativa no ámbito dixital.

"O castelán está en mellor situación que o alemán ou o francés grazas á súa presenza global

A tecnoloxía lingüística produce software capaz de procesar a linguaxe humana. Algúns dos exemplos máis coñecidos son correctores ortográficos e gramaticales, asistentes interactivos para móbiles (como Siri en iPhone), sistemas de diálogo telefónico, tradutores automáticos, motores de procura web e as voces sintéticas utilizadas polos sistemas de navegación GPS.

En España, “temos dúas situacións moi diferentes”, explica Asunción Moreno, investigadora da Universidade Politécnica de Cataluña e coordinadora da parte española do informe. “Por unha banda está o castelán, que está nunha situación moi boa porque é unha lingua global e en EEUU hai moitas compañías que teñen sistemas de tradución ou de procesamiento da linguaxe que teñen como obxectivo o español”, conta. “Temos o exemplo do Siri, que está en castelán xusto despois do inglés”, engade. ”Isto dálle un impulso que non teñen ningunha das demais linguas europeas salvo o inglés, nin sequera o alemán ou o francés”, conclúe Moreno.

Do resto de linguas cooficiais, o catalán sería a que se atopa en mellor situación. Grazas ao apoio dos gobernos, tanto da Generalitat de Cataluña como da Generalitat Valenciana e dos equipos de moitas das súas universidades, desenvolveron tecnoloxías que se empregaron para facilitar a adaptación desta lingua á contorna dixital. Isto permitiu que nalgúns parámetros supere a linguas de países como Bulgaria ou Grecia. Tanto o eúscaro como o galego atópanse nunha situación algo peor, aínda que aínda así obteñen mellores resultados que o lituano, o islandés ou o maltés.

"21 é o número de linguas europeas que están en perigo de extinción dixital

“O eúscaro non vai desaparecer, pero o que non haxa un bo tradutor para utilizalo no móbil ou en documentos oficiais, por exemplo, fai que ao final o seu uso se vaia a restrinxir ao ámbito familiar”, opina Inmaculada Hernaez, a investigadora da Universidade do País Vasco que se ocupou do informe sobre o eúscaro.

As aplicacións de tecnoloxía lingüística baséanse fundamentalmente en métodos estatísticos, que requiren cantidades moi grandes de datos. Obtelos resulta particularmente difícil para os idiomas pequenos, e iso reverte na escasa calidade de moitos sistemas estatísticos, como pode verse, por exemplo, nas traducións, a miúdo absurdas, producidas polos sistemas de tradución automática en liña para algunhas linguas. O eúscaro, por exemplo, é un idioma con poucos falantes, moi distinto de case todas as linguas europeas e que ademais tivo unha normalización recente, unha serie de circunstancias que incrementan os problemas á hora de atopar textos para axudar ás aplicacións a aprender “o idioma”.

Cooperación entre institucións

Por este motivo, é moi importante a colaboración entre as institucións que poden achegar os datos e o coñecemento necesarios para desenvolver as tecnoloxías lingüísticas, particularmente nos idiomas máis débiles. As responsables dos informes das linguas de España aseguran que esta colaboración existe, particularmente intensa e frutífera no caso do catalán. Chama a atención que, segundo comenta Marta Melero, investigadora de Barcelona Media e responsable do informe sobre o castelán, precisamente esta vontade para compartir as grandes cantidades de textos necesarios sexa menor no caso do castelán. “A RAE dedicou un esforzo importante para dixitalizar o seu patrimonio, pero en ocasións a cooperación coas institucións que poden proporcionar estes textos non foi todo o fluída que debería”. Posiblemente, expón Merlo, a sensación de idioma minoritario fai que se vexa como máis necesaria a cooperación.

«O eúscaro non vai desaparecer, pero o seu uso poderíase restrinxir ao ámbito familiar» 
INMACULADA HERNAEZ 
Investigadora da Universidade do País Vasco

Ademais da cooperación entre institucións, Nuria Bel, responsable do informe sobre o catalán, menciona algúns aspectos de regulación que poden servir para incentivar a pluralidade lingüística. “Mentres que en España non pode entrar un teclado que non teña a ñ, si pode entrar un corrector de textos que non teña aplicación para o catalán, e este tipo de factores son importantes”, sinala Bel.

O informe de META-NET busca concienciar sobre a necesidade de prestar atención ao desenvolvemento das tecnoloxías lingüísticas. Por unha banda, para avanzar na construción de un mercado dixital único, que mellore a libre circulación de bens, produtos e servizos, pero tamén polo interese propio da diversidade lingüística e cultural europea. Para logralo, os responsables políticos e as empresas deberán aprender a valorar unhas tecnoloxías que son custosas pero, segundo os autores destes informes, necesarias e rendibles.

REFERENCIA
http://www.meta-net.eu/whitepapers

Maís sobre Materia