La Academia del Euskera lanza unCorpus amplio y equilibrado para mejorar el conocimiento y estudio del euskera, con colaboración de 68 entidades.

La Academia del Euskera ha tomado una firme iniciativa para impulsar el conocimiento y uso del idioma a través de su proyecto Euskararen Erreferentzia Corpusa (EEC), presentado recientemente en Bilbao.

Esta primera versión del corpus resulta de un trabajo que se remonta a cuatro años atrás, con la intención de proveer a investigadores, docentes y la sociedad en general de una herramienta robusta para el estudio del euskera.

El Corpus de Referencia del Euskera abarca textos producidos en euskera desde el año 2000 hasta 2023, reuniendo un total de 123.124 documentos que suman aproximadamente 154,21 millones de palabras. Este cuerpo de textos no solo representa la riqueza lingüística del euskera, sino que también está diseñado para reflejar la diversidad temática y el uso actual del idioma en diversos contextos.

Andrés Urrutia, presidente de Euskaltzaindia, enfatizó que este corpus es un esfuerzo que nace de la colaboración con 68 entidades privadas y públicas, incluyendo medios de comunicación y agentes sociales.

Según Urrutia, "se trata de un corpus de referencia que busca un equilibrio y pretende ofrecer una imagen fidedigna del euskera contemporáneo".

La consejera de Cultura y Política Lingüística del Gobierno Vasco, Ibone Bengoetxea, también estuvo presente en la presentación, donde destacó la importancia del EEC como un pilar que otorga prestigio a la lengua.

Para Bengoetxea, el contenido del corpus no solo forma parte de la historia del idioma, sino que también servirá como un instrumento para guiar su futuro en un mundo cada vez más dominado por las tecnologías lingüísticas.

Miriam Urkia, responsable del proyecto y académica de Euskaltzaindia, recordó los inicios de la creación de corpus en la Academia, que comenzó en la década de 1980.

En su intervención, destacó la necesidad de un corpus más amplio y equilibrado para reflejar la realidad del uso del euskera actual, ya que iniciativas previas se limitaban a muestras más pequeñas y menos representativas.

El EEC ha sido estructurado considerando criterios estrictos para asegurar su referencialidad. Se clasifica en secciones de ficción y no ficción, abarcando tanto la literatura como documentos informativos, lo que garantiza un enfoque diverso. Además, cada texto ha sido lematizado, permitiendo consultas específicas a través de formas y categorías gramaticales.

Este corpus está diseñado para ser actualizado anualmente, asegurando así que continúe siendo una herramienta relevante y útil en la enseñanza de la lengua y otros ámbitos de la lingüística.

La Academia prevé que el EEC facilitará la resolución de dudas léxicas y gramaticales para traductores, docentes y estudiantes.

A medida que el euskera enfrenta el desafío de adaptarse a un mundo tecnológico en constante evolución, esta iniciativa se presenta como una respuesta fundamental para no solo conservar, sino también revitalizar el uso del idioma.

En tiempos donde la globalización puede poner en riesgo las lenguas minoritarias, proyectos como el Euskararen Erreferentzia Corpusa son cruciales para fortalecer la identidad cultural y lingüística del pueblo vasco.

Con la puesta en marcha de este corpus, Euskaltzaindia no solo busca un enfoque académico, sino también social, promoviendo el euskera como una lengua viva y relevante en el día a día de los ciudadanos.

Con el EEC, se espera no solo documentar el uso del idioma, sino también inspirar nuevas generaciones a apreciar y utilizar el euskera en todos los ámbitos de su vida.