Datos abiertos y Tecnologías de Procesamiento del Lenguaje en la IODC 2016

IODC2016

Motivo

El desarrollo de Internet y, en general de las tecnologías de la información y las comunicaciones (TIC), genera un volumen abrumador de información textual en soporte electrónico que crece vertiginosamente. Este volumen de información ya no es abordable humanamente, pero la necesidad de aprovecharla es imperiosa. Por eso, la explotación automática de esta información es urgente y necesaria.

Las Tecnologías del Lenguaje son un conjunto diverso de tecnologías que van jalonando el camino hacia una compresión automática cada vez más profunda del lenguaje humano. Engloban tanto las tecnologías de procesamiento de lenguaje natural (PLN) como de traducción automática. Son las tecnologías que permiten explotar automáticamente ese volumen de información que resulta ya inabordable.

En consecuencia, las Tecnologías del Lenguaje generan un sector industrial emergente, innovador y transversal.

Las organizaciones acumulan enormes cantidades de información textual en formato electrónico que se pueden convertir en combustible para la industria de las tecnologías del lenguaje.

Hay que reparar en que el valor de estos textos tiene dos vertientes:

  • Por un lado, está su valor directo como materia prima informativa para generar información relevante mediante tecnologías del lenguaje.
  • Pero, no menos importante, también tienen una enorme utilidad para crear y entrenar la propia tecnología del lenguaje (Un buen ejemplo son las memorias de traducción de la Dirección General de Traducción de la Comisión Europea, que son el conjunto de datos más bajado del portal de datos abiertos de la UE).

Pero se puede ser más ambicioso aún. La confluencia de Datos Abiertos y Tecnologías del Lenguaje puede ser el germen de una nueva revolución del conocimiento, de una nueva Ilustración.

Pero para lograr sus potenciales beneficios, hay que resolver los retos sociales, económicos, legales y técnicos específicos que plantea.

English version: Open Linguistic Data IODC 2016.

Datos abiertos y Tecnologías de Procesamiento del Lenguaje en la IODC 2016

Para poner el foco en los potenciales beneficios de la confluencia de Datos Abiertos y Tecnologías del Lenguaje, y abordar los retos sociales, económicos, legales y técnicos que plantea, se realizaron dos eventos en el contexto de la Conferencia Internacional de Datos Abiertos IODC 2016, que han tenido lugar en Madrid en octubre de este año.

El primero fue un taller el día 5 de octubre (15:30-19:30), donde expertos en diferentes aspectos de esta poliédrica materia tuvieron tiempo para compartir y discutir entre ellos, y con la audiencia, sus diferentes pero reveladoras visiones y experiencias, en un esfuerzo colectivo por enriquecer nuestro conocimiento sobre la confluencia de Datos Abiertos y Tecnologías del Lenguaje.

El segundo fue una “impact session" el 6 de octubre (16.45-17:45), donde destacados expertos compartieron con nosotros fundadas reflexiones sobre los retos y oportunidades de la confluencia de Datos Abiertos y Tecnologías del Lenguaje desde diferentes ángulos, que ilustraron con casos de uso en los que han estado involucrados personalmente.