Las dos administraciones firman un convenio para crear un corpus lingüístico que garantice el futuro del idioma
El euskera es una lengua “en peligro de extinción digital”. Ese diagnóstico, reflejado con la claridad de los avisos sobre los que hay que actuar urgentemente, se recoge en un convenio firmado entre el gobierno de España y el del País Vasco para asegurar el futuro de la lengua vasca en el mundo de la Inteligencia Artificial, según recoge este viernes el Boletín Oficial del Estado (BOE). El convenio firmado entre las dos administraciones explicita paso a paso la hoja de ruta para asegurar la supervivencia online de este idioma en teléfonos inteligentes, tablets, o programas de Inteligencia Artificial. Así, se invertirán 10,5 millones hasta 2028. Se diseñará un esquema de trabajo que pueda servir a otras lenguas minoritarias. Y se creará un corpus lingüístico del que puedan beber programadores y desarrolladores interesados en que sus herramientas se pueden relacionar con los usuarios en vasco. ¿El objetivo? “Incrementar la presencia del euskera en el ámbito digital, con especial foco para su uso en Inteligencia Artificial”.
Para llegar hasta ese punto, hay que recopilar miles de horas de audios y millones de segmentos de texto. Luego hay que etiquetarlos, para que sean reconocibles por programas y programadores. Y una vez archivados, hay que usarlos para entrenar a los algoritmos de aprendizaje supervisado. El objetivo es que aprendan patrones y hagan predicciones con precisión. Tener un corpus lingüístico para que investigadores y desarrolladores puedan acelerar la creación de sistemas de reconocimiento de voz en vasco, de aplicaciones (apps) de traducción automática para el euskera, y de asistentes conversacionales.







