

Secciones
Servicios
Destacamos
Mada Martínez
Santander
Lunes, 11 de julio 2022, 11:08
Inteligencia Artificial (IA) y Real Academia Española (RAE). A los más novatos de la gran revolución tecnológica quizá les resulte una extraña pareja de baile, ... pero nada más lejos de la realidad: la institución que dirige Santiago Muñoz Machado lleva años volcada en la tarea de situar al español en el centro del desarrollo digital, y, según dice la propia institución, las grandes empresas tecnológicas han recogido el guante que les ha lanzado la RAE. Resumido de una forma muy elemental, el propósito de la Academia es que las máquinas hablen un buen español, que el idioma no se fragmente en tantas piezas como dispositivos existentes para traducir, informar o corregir a los 600 millones de hispanohablantes, y que no pierda, en definitiva, su unidad.
Es una tarea monstruosa y para palpar qué momento vive el binomio 'Lengua española e inteligencia artificial', la RAE organizó la pasada semana dos jornadas de trabajo en la UIMP con expertos y estudiosos del asunto. «Que el español se degradase ha sido un temor que hoy está bastante aliviado. No pesa tanto esa preocupación como nos ha afectado tiempo atrás, cuando empezamos con todo esto», revela Muñoz Machado, que inauguró el curso junto con Carme Artigas, secretaria de Estado de Digitalización.
Con la inteligencia artificial cada vez más asentada en procesos administrativos, médicos o fiscales; con decenas de buscadores, aplicaciones o asistentes personales radicados en nuestra cotidianidad, la RAE se ha puesto manos a la obra para dar su lugar al español en medio de esta agitación tecnológica. Con buena parte de los sistemas de inteligencia artificial entrenados en inglés o en chino, había que hacerlo. «Las máquinas, para entenderse, necesitan poquito vocabulario, y tampoco necesitan hablar con calidad ni con belleza, pueden entenderse de cualquier manera y eso tiende a achicar y a reducir el léxico, y también a eliminar las variantes fonéticas. Todo esto hubiera podido ser grave, porque además esas máquinas están muy presentes en nuestras vidas, son el familiar que más frecuentemente visitamos –el teléfono o los relojes inteligentes, sin ir más lejos–, y nos pueden transmitir sus maneras de decir y sus expresiones a nosotros, a nuestros hijos, a la gente que está empezando ahora con más fuerza, pero también a los que tienen menos capacidad de entender», reflexiona Muñoz Machado.
A modo de muro de contención, pero también como expositor de sus propias herramientas digitales, la RAElanzó en 2019 un proyecto con nombre de heroína galáctica: LEIA. Impulsada inicialmente junto con Telefónica, el proyecto cuenta con la colaboración de Google, Amazon, Microsoft, Twitter y Facebook, y el apoyo de Fundación Endesa. El acuerdo de colaboración dicta que estas empresas y organismos tendrán que trabajar con la Academia en el desarrollo de sus asistentes de voz, de sus procesadores de texto, buscadores, 'chatbots', sistemas de mensajería instantánea o redes sociales, así como «seguir los criterios sobre buen uso del español aprobados por la RAE», explica la institución. También se llegó al compromiso de que el español esté disponible como lengua de uso de sus productos y servicios.
LEIA aparece en el nuevo Proyecto Estratégico para la Recuperación y Transformación Económica (Perte) que ha diseñado el Gobierno de España bajo el título 'Nueva economía de la Lengua'. Está dotado con 1.100 millones de los fondos europeos y aspira a que «los sistemas integren la riqueza de nuestras lenguas cooficiales en beneficio de la economía y de las personas», en palabras de la vicepresidenta primera, Nadia Calviño. ¿Es este un buen paso al frente? «Estamos muy satisfechos de que exista un Perte con una dotación tan importante para proyectos lingüísticos. Es una oportunidad que no ha tenido nunca la lengua», responde Muñoz. La RAE presentó varios proyectos y, por el momento, el único respaldado es LEIA. Está por definirse, añade el director, su encaje final.
Volviendo a las jornadas de la RAE en Santander, estas se han basado en varias preguntas: ¿Es correcto el español que hablan, traducen o corrigen las máquinas? ¿Sueñan las máquinas con El Quijote? ¿Cómo puede ayudar la lengua al desarrollo digital?
Varios expertos en lingüística e innovación han tratado de darles respuesta, entre ellos, la catedrática de la Universidad Politécnica de Madrid Asunción Gómez-Pérez. Experta en inteligencia artificial, es también académica electa de la RAE, lo que evidencia el interés de la institución por este tema. «Es una forma de conectar los dos mundos. El director de la RAE está potenciando la inclusión de todos estos aspectos tecnológicos, especialmente, para que los recursos de la Academia puedan ser utilizados por las grandes empresas tecnológicas que ofrecen muchos productos y servicios basados en el lenguaje», indica. El objetivo es sencillo: «Lo que se está intentando evitar es que cada empresa tecnológica genere su propio diccionario, porque para eso existe el Diccionario de la Academia (DRAE), que tiene todas las palabras consensuadas después de años y debates», expone la catedrática, que habló en la UIMP sobre datos multilingües y ontologías.
Ella trabaja con palabras en inteligencia artificial. Si a las definiciones del DRAE (definiciones en lenguaje natural) acudimos en caso de duda o ganas de aprender, lo que Gómez-Pérez hace con las ontologías es extraer la esencia de las palabras, definiendo bien sus propiedades y las relaciones que establecen con conceptos cercanos, para «explicarlos en un formato en el que el ordenador entienda».
Su trabajo y el de otros muchos investigadores tiene un alto grado de abstracción. El catedrático Alfonso Ureña López explicó en Santander una de las partes clave de la inteligencia artificial: el Procesamiento del Lenguaje Natural (PLN), algo en lo que se trabaja desde hace décadas y que ahora vive un momento de «explosión» gracias a la madurez de la tecnología. A grandes rasgos, se trata de procesar el lenguaje humano para que las máquinas puedan comprender y, a su vez, generar lenguaje. «Lo que se pretende es facilitar esa interrelación entre el hombre y las máquinas para que haya una comunicación mucho más fluida y menos rígida que los lenguajes actuales». Se usa en múltiples aplicaciones, en buscadores, por ejemplo. No es en absoluto, añade Ureña, algo trivial.
«Estamos asistiendo a la revolución más grande de la inteligencia artificial en general y del procesamiento del lenguaje natural en particular», apunta este experto, que ejemplifica esta transformación en ámbitos como el de la traducción automática, que se han perfeccionado mucho. «Estamos reduciendo la torre de Babel, la vamos a derribar en cuanto a barrera idiomática, estoy convencido», dice Ureña, que se atreve a ir más allá, al hecho de que la máquina sea capaz de «responder preguntas complejas». ¿Todo esto anticipa una nueva forma de comunicación entre personas y entre personas y máquinas? «Por supuesto que sí, porque esto aplicado a la robótica puede cambiar totalmente el panorama actual», avanza Ureña, que menciona además la posibilidad de que las máquinas lleguen ellas mismas a programarse.
La Sociedad trabaja ahora en proyectos biomédicos, económicos o jurídicos con inteligencia artificial. Por su parte, el Instituto de Ingeniería del Conocimiento (IIC) acaba de lanza a Rigoberta, un modelo de 'deep learning', entrenado para la comprensión general de nuestro idioma.
«La mayor parte de los avances se están haciendo en inglés. Y aunque falta mucho para ponerse al nivel del inglés, tenemos la capacidad y es el momento para seguir invirtiendo en el español. Y para hacerlo desde España. El español también tiene un sitio en la inteligencia artificial», comparte Marta Guerrero, coordinadora del Instituto y lingüista computacional.
Corpus de referencia
¿Corpus lingüístico? Una de las herramientas con las que la RAE contribuye a un español de «calidad» para el aprendizaje de las máquinas es, precisamente, el Corpus del Siglo XXI, conjunto de miles de textos –entre novelas, guiones, noticias de prensa o conversaciones transcritas– y millones de formas empleadas para conocer el significado y características de palabras, expresiones y construcciones. «El corpus significa datos de calidad. A diferencias de otros corpus, los de la RAE tienen un diseño previo que establece la cantidad de formas que se van a seleccionar y además se codifican», explica su responsable, Mercedes Sánchez, es decir, el corpus se sustenta en unos «estándares de calidad» que beneficia el análisis del español de España y de América.
La RAE sigue ahora seleccionando textos para este corpus del siglo XXI –que va del año 2001 hasta la actualidad–, por lo que, diseño y codificación mediante, «tenemos que seguir dándole alimento».
¿Ya eres suscriptor/a? Inicia sesión
Publicidad
Publicidad
Te puede interesar
Publicidad
Publicidad
Esta funcionalidad es exclusiva para suscriptores.
Reporta un error en esta noticia
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.