Este material, que involucra las distintas variedades de la lengua española que se hablan en España y los países latinoamericanos, contribuirá a entrenar las aplicaciones de inteligencia artificial de la compañía, poniendo el foco en evitar sesgos del lenguaje y en mejorar las habilidades de procesamiento del lenguaje.
Hace dos años, Santiago Muñoz Machado, director de la RAE, proclamó a los cuatro vientos el nuevo reto de la centenaria institución: enseñar español a las máquinas, evitar que la tecnología degradase la lengua de Cervantes. Con ese ánimo creó el proyecto LEIA (acrónimo de Lengua Española e Inteligencia Artificial), una de las grandes apuestas de futuro de la institución, que está inmersa en una renovación tecnológica, asegurando su posteridad.
"El proyecto LEIA se ha ideado con un objetivo principal: que las máquinas, y todas las herramientas digitales, utilicen un correcto español. A partir del siglo XVII la RAE consiguió que sus normas fueran seguidas y se armonizaran y generalizaran los mismos usos ortográficos, gramaticales y léxicos de nuestra lengua. Ya en los siglos XIX y XX logró mantener su unidad, y ahora en el siglo XXI la Academia quiere regular el lenguaje de las máquinas, de la inteligencia artificial, para continuar una labor desempeñada con éxito durante más de 300 años", indicó ahora a Muñoz Machado a la prensa española.
El catedrático auguró que el imperio del inglés en la tecnología, un campo donde el castellano aún tiene muy poca presencia, tal y como corroboran los sucesivos informes de su salud, se resquebrajará gracias a la traducción automática, que lo revolucionará todo. "Dentro de poco, no importará en qué idioma se suministre información a las redes, se podrá acceder al conocimiento desde cualquier lengua", vaticinó.
Muñoz Machado recordó que en 2016 una computadora tradujo "Guerra y paz", de Leon Tolstoi, en solo dos segundos y medio, algo que hoy podría hacer en solo unas décimas, aunque a estas alturas el reto ya no es la velocidad, sino la calidad. "Será una especie de demolición de Babel en la que vamos a estar presentes. Va a ocurrir y va a ocurrir pronto", sostuvo el titular de la RAE.
El procesamiento de lenguaje natural (NLP, por sus siglas en inglés), con el que trabajan en Microsoft Azure, ya permite detectar el idioma de un texto, identificar sus frases clave, analizar el sentimiento que en el predomina, convertirlo a voz e, incluso, resumirlo.