Investigación
Crean el primer sistema masivo de inteligencia artificial en español capaz de resumir textos automáticamente
La actualización del proyecto MarIA de la Barcelona Supercomputing Center se publica en abierto para extender el uso
Eso puede ser útil para desarrolladores de aplicaciones, grupos de investigación, empresas, administraciones públicas o la sociedad en general, apuntan desde la Barcelona Supercomputing Center. En este sentido, los modelos desarrollados con el sistema MarIA en inglés se han utilizado, por ejemplo, para generar sugerencias de texto en aplicaciones de escritura. También se plantea su uso para resumir contratos o documentos complicados que detallan las prestaciones de un producto, según lo que quiera saber al consumidor. Además, sirve buscar conceptos concretos en bases de datos gigantescas y relacionarlos con otras informaciones relevantes.
Entrenada con el MareNostrum
El resultado del proyecto MarIA nace del entrenamiento del sistema en el superordenador MareNostrum, situado en Barcelona, y de la aplicación de una potencia de cálculo de 9,7 trillones de operaciones (969 exaflops). «Estamos encantados de poner a nuestros expertos en lenguaje natural e inteligencia artificial y la capacidad de cálculo de nuestras infraestructuras al servicio de los retos relevantes para la sociedad, como lo que da respuesta esta iniciativa,» apunta al director del BSC-CNS, Mateo Valero.
En la misma línea, este proyecto enmarcado y financiado con el Plan de Tecnologías del Lenguaje de la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA) estatal, tiene que suponer también un impulso de la lengua española y la innovación en el ámbito internacional. Con proyectos como MarIA se dan «pasos firmes hacia una inteligencia artificial que piense en español, cosa que multiplicará las oportunidades económicas para las empresas y la industria tecnológica española», valora a la secretaria de Estado de Digitalización e Inteligencia Artificial, Carme Artigas. A su vez, la directora de la Biblioteca Nacional de España, Ana Santos, ve en este proyecto «un hito en el campo del procesamiento del lenguaje natural». Su institución ha colaborado con datos que llegaron a constituir 135 mil millones de palabras que ocupaban 570 Gigabytes.