"La institución presenta sus nuevas herramientas de IA. A partir de ahora podrá analizar más de un millón de palabras al día para buscar neologismos y estudiar su posible incorporación al Diccionario de la Lengua Española o a otras obras académicas
La inteligencia artificial se sienta en la RAE
Fue en 2019 cuando Santiago Muñoz Machado, director de la RAE, habló por primera vez de LEIA (bello acrónimo de Lengua Española e Inteligencia Artificial). Aquel era un ambicioso proyecto que pretendía enseñar a hablar bien a las máquinas en un momento en el que casi nadie pensaba en ellas, y que se convirtió en uno de los grandes objetivos de la institución desde entonces. Muñoz Machado consiguió implicar a las grandes empresas tecnológicas en el empeño, que ahora entra en una nueva dimensión. Conquistada esa cima (la RAE ha formado hasta a los teclados predictivos de Google o Microsoft, por poner un ejemplo), la Academia quiere servirse ahora de las máquinas para ampliar sus capacidades, para multiplicarlas. De momento ha diseñado varias herramientas que se abrirán al público próximamente, y que ya funcionan dentro de la institución desde hace semanas. Por decirlo con las palabras de Muñoz Machado: «Estamos empeñados en subirnos a los hombros de ese gigante».
¿Por dónde empezar? La propia LEIA se explicó a sí misma en un vídeo de presentación proyectado en la Docta Casa: «Estoy entrenada con siglos de sabiduría en nuestra lengua y millones de conversaciones. ¿Y sabéis qué? No quiero corregiros, quiero entenderos, seguir entendiendo con vosotros, porque lo que decís y cómo lo decís también es parte de lo que somos. Vosotros habláis, la RAE os escucha y trabaja para preservar la unidad en la diversidad. Y yo aprendo. Queridos humanos, bienvenidos al futuro del español. Uno en el que nos entendemos aún mejor».
Lo que siguió después fue la presentación de las nuevas herramientas. La gran novedad es el Observatorio de Palabras, que gracias a la inteligencia artificial podrá analizar un millón de formas al día, y seleccionar entre ellas las palabras o expresiones que no se encuentran en el Diccionario de la RAE. Estos términos pueden ser neologismos, derivados, tecnicismos, regionalismos y extranjerismos.
Las fuentes de datos son las redes sociales (X, principalmente) y la versión digital de los grandes periódicos españoles y latinoamericanos, a los que la RAE ha pedido permiso. «El Observatorio nos va a permitir analizar en tiempo semirreal las nuevas palabras que se están utilizando», destaca Asunción Gómez Pérez, académica experta en IA y responsable de LEIA. Además, ofrece una evidencia estadística de lo que se está estudiando: te da el número total de apariciones de una palabra en un arco temporal, la frecuencia de uso, la dispersión geográfica… De pronto, el radar de la RAE alcanza niveles impensables antes de la IA, tanto en precisión como en extensión. Y en rapidez. «Con esto entramos en una nueva escala», subraya Gómez Pérez, que insiste en que con esto vemos cómo «la IA puede ayudar al análisis de la lengua». No todo va a ser apocalipsis climático y laboral.
De momento, esta aplicación, como el resto de las presentadas, solo está funcionando de forma interna, aunque todas tendrán su versión pública y gratuita a través del portal LEIA, una suerte de nube que alojará todas sus aplicaciones, y al que podrá accederse desde la web de la RAE. ¿Cuándo estará disponible? «Próximamente».
La idea, claro, es que el Observatorio sirva a los lexicógrafos, no que los sustituya. Ellos elegirán las palabras y decidirán cuáles merecen su estudio, y cuáles merecen ser destacadas y mostradas y explicadas al hablante a través del portal. Ahí pueden estar 'random' o 'pódcast', por poner dos casos. El Observatorio ofrecerá datos sobre términos de uso actual con comentarios provisionales, ya que, al no estar incluidos algunos de ellos en las obras académicas, podrán verse modificados en el futuro. La presencia de una palabra en la parte pública del Observatorio solo significa que ha sido detectada y que se está estudiando.
Como siempre, serán las comisiones y el pleno de la RAE, así como las academias americanas, quienes decidan qué palabras entran finalmente al Diccionario de la Lengua Española. La máxima es: todo está supervisado, no hay nada automático donde la IA tome sus decisiones.
Esta es solo la primera versión del Observatorio. Quién sabe si dentro de un tiempo la herramienta permitirá encontrar nuevos usos de palabras ya existentes y recogidas en el diccionario: la posibilidad tecnológica existe. Es una cuestión de tiempo… y de dinero. Estas herramientas se han financiado con los fondos Next Generation de la Unión Europea a través del Ministerio para la Transformación Digital y de la Función Pública. La partida ha sido de cinco millones de euros.
Hay otra herramienta que ayudará a los académicos a conocer mejor la lengua: el Recopilador de la Diversidad Lingüística del Español, que funciona al revés que el Observatorio. Aquí es la RAE la que les pide a los hablantes que le digan qué palabra usan, por ejemplo, para referirse a las botas de agua o al flash (el helado de hielo). Es una aplicación que funciona con retos o preguntas así. Ya hay quinientos diseñados. Y habrá especiales de Navidad o verano, momentos que tienen un vocabulario específico y muy variable según la zona. El objetivo es conseguir información de esas palabras que son cotidianas pero no aparecen con frecuencia en los medios de comunicación. Por supuesto, lo primero que te pregunta la aplicación al entrar es: ¿en qué lugar has aprendido a hablar español?
En la Academia ya han probado esta aplicación en un 'datatón' (maratones de recopilación de datos) con mil quinientos niños de quinto de primaria. Una de las grandes preocupaciones ha sido cuidar el tema de la accesibilidad. Todas las aplicaciones están diseñadas para ser intuitivas. «La participación ciudadana es clave en este apartado del proyecto», subrayan.
Más cosas. La RAE ha creado un verificador lingüístico capaz de detectar errores ortográficos, sintácticos, léxicos y morfológicos en un texto dado. Y no solo eso: sugiere correcciones y, además, aporta una explicación del error con enlaces a la doctrina de la RAE que está siguiendo. Quizás hayan terminado al fin los días del laísmo…
La IA también ayudará a los expertos de la RAE a resolver las dudas de los hablantes de forma más rápida, más eficiente. Hasta ahora, estos podían lanzar sus preguntas a través de X, donde obtenían una respuesta, o a través del formulario de la RAE. Ahora los lingüistas tendrán una IA que clasifique las dudas por tipo (léxica, morfológica, sintáctica, etc.) y que, además, les sugiera las tres respuestas más adecuadas que ya se han ofrecido en preguntas similares. Es una forma de agilizar el trabajo. «Para nosotros va a suponer la posibilidad de rescatar de ese repositorio respuestas ya dadas en estos veintisiete años de trabajo. Y dar, por tanto, en menor tiempo respuesta a esas consultas más recurrentes. Y a los usuarios les va a permitir mediante un buscador de preguntas-respuestas obtener respuestas a preguntas idénticas realizadas anteriormente», explican desde dentro.
En la parte pública el usuario podrá introducir su duda en un buscador, que cuenta con un sistema de autocompletado, y la herramienta buscará esa consulta o consultas similares entre las ya respondidas para ofrecer la información solicitada. En caso de que el sistema aún no tenga una respuesta exacta para la pregunta planteada, el consultante podrá enviarla a la RAE para obtener una respuesta personalizada.
Y hablando de repositorios: al fin la RAE ha completado la digitalización de sus célebres fichas. Gracias a la IA se han trasladado a la nube las 800.000 fichas de punto rojo, donde estaban apuntados el primer uso conocido de las palabras. Muchas eran manuscritas, de ahí la dificultad del proceso. Se podrán consultar a través de un visor en el portal LEIA: la digitalización incluye la imagen de la ficha en formato digital y la extracción de su contenido.
Con este último empujón, los once millones de fichas de la Academia se han salvado de los peligros del papel. Ya forman parte de esa nueva dimensión en la que ha entrado la RAE, que a partir de ahora observará 365 millones de palabras cada año."
Tengo como referencia para consultas el Diccionario de la RAE, en el año 2025 inicie la publicación de Vocabulario, con palabras que son nuevas para mi, las ubico con la etiqueta Vocabulario
Estas publicaciones comparto en mi entorno, a la fecha son 24.
Si preciso una mayor explicación, utilizo otros sitios, algunos que he compartido en mi blog: unos son formales y otros con una explicación desde la sabiduría que no se genera en la Academia.
2016 Definición
2017 Wikilengua del español
2018 Resolución de crucigrama2018 Glosario en Moodle
2018 Felicitación Médica por Navidad
2019 Diccionario Términos Jurídicos
2019 Diccionario ideológico Feminista
2019 Academia Ecuatoriana de la Lengua
2021 Para insultar con propiedad - Diccionario de insultos
2022 Diccionario de Lengua de Señas Ecuatoriano “Gabriel Román”
2022 De ¡Caras vemos, ortografía no sabemos! a Diccionario Terminológico Quiteño
2022 Libro Diccionario de dudas y dificultades de la lengua española
2023 Diccionario Los Ecuatorianismos
2017 Wikilengua del español
2018 Resolución de crucigrama2018 Glosario en Moodle
2018 Felicitación Médica por Navidad
2019 Diccionario Términos Jurídicos
2019 Diccionario ideológico Feminista
2019 Academia Ecuatoriana de la Lengua
2021 Para insultar con propiedad - Diccionario de insultos
2022 Diccionario de Lengua de Señas Ecuatoriano “Gabriel Román”
2022 De ¡Caras vemos, ortografía no sabemos! a Diccionario Terminológico Quiteño
2022 Libro Diccionario de dudas y dificultades de la lengua española
2023 Diccionario Los Ecuatorianismos










.jpeg)










