Reutilización de la información del sector público y datos abiertos

Un recurso procedente de las Administraciones Públicas con gran utilidad práctica para TL es el relativo a los datos abiertos. Muchas organizaciones acumulan enormes cantidades de información textual en formato electrónico, buena parte de las cuáles se puede convertir en combustible para la industria del procesamiento de lenguaje natural, la traducción automática y los sistemas conversacionales. Por ello se quiere apoyar la generación, estandarización y difusión de recursos lingüísticos creados en el contexto de la actividad de gestión pública propia de la Administración aprovechando el marco de la política de Reutilización de la Información del Sector Público (RISP), que representa un cauce para el desarrollo de estos recursos lingüísticos, pues tiene como objetivo poner a disposición de la sociedad la información que el propio sector público genera en el ejercicio de sus funciones.

En este ámbito, dentro del Plan TL, se realizan acciones para poner el foco en los potenciales beneficios de la confluencia de Datos Abiertos y Tecnologías del Lenguaje, y abordar los retos sociales, económicos, legales y técnicos que plantea.

En este sentido en Plan TL participó en la Conferencia Internacional de Datos Abiertos (IODC 2016) que se celebró en Madrid. Por otro lado se están realizando diversos estudios para favorecer la apertura de datos de la Administración Pública, por ejemplo el estudio de recursos de interés para traducción automática o el estudio sobre documentos reutilizables como recursos lingüísticos.