Plataformas y sistemas de procesamiento lingüístico de alto rendimiento

Resumen del Estudio

El objetivo de este informe es efectuar un estudio amplio sobre diferentes herramientas, técnicas, métodos y arquitecturas existentes para desarrollar e implantar sistemas de procesamiento lingüístico de alto rendimiento. La principal característica de estos sistemas es la de ser capaz de procesar lingüísticamente grandes volúmenes de texto dentro de unos límites temporales restringidos.

En el informe se analizan las principales tecnologías descritas en las áreas de procesadores de PLN, estándares de anotaciones, contenedores de anotaciones, cadenas de procesamiento, arquitecturas distribuidas, esquemas de ejecución, procesado paralelo, despliegue de sistemas, etc. El objetivo del estudio es doble. Por un lado, ofrecer un panorama actual del estado de estas tecnologías, y proporcionar una terminología común que ayude en la tarea de evaluar y comparar soluciones PLN dentro del Plan de Impulso de las Tecnologías del Lenguaje, perteneciente a la Agenda Digital para España. Por otro lado, el informe pretende ser un punto de partida para empresas que estén interesadas en el área de la minería de textos y PLN.

Autores

El informe ha sido realizado por una comisión de expertos de reconocido prestigio en el ámbito del PLN y sistemas distribuidos. Los autores del informe son los siguientes:

  • Aitor Soroa, Universidad del País Vasco / Euskal Herriko Unibertsitatea
  • German Rigau, Universidad del País Vasco / Euskal Herriko Unibertsitatea
  • Jordi Porta, Centro de Estudios de la Real Academia Española
  • Jordi Atserias, Trovit
  • Xavier Gómez Guinovart, Universidade de Vigo
  • Horacio Saggion, Universitat Pompeu Fabra

Estudio completo

Plataformas y sistemas de procesamiento lingüístico de alto rendimiento [PDF] [2.9 MB]