IberSPEECH 2018

Campaña

Nombre de la campaña

iberSPEECH 2018

Nombre de la tarea

Albazyn Evaluation Challanges

Tipo de tarea

Search on Speech Evaluation

Speaker Diarization Evaluation

Multimodal Diarization Challenge (MDC)

Search on Speech Challenge (SoSC)

Descripción de la tarea

Tareas de tecnología de voz: reconocimiento automático de voz, identificación de oradores o recuperación de documentos hablados

Tema de la tarea

Sistemas conversacionales: reconocimiento del habla, diarización (transcripción con locutor asociado), diarización multimodal (localización de locutor desde vídeo y audio), búsqueda de términos.

Fecha evento / edición

2018

Organizadores
  • Alfonso Ortega, Vivolab, Aragon Institute for Engineering Resarch (I3A) University of Zaragoza, España
  • Eduardo Lleida, Vivolab, Aragon Institute for Engineering Resarch (I3A) University of Zaragoza, España
  • Luis Javier Rodríguez Fuentes, Universidad del País Vasco, Españ
destinatarios

Abierto a quien quiera participar: grupos de investigación académicos y de la industria.

Elegibilidad

Cualquiera puede participar (grupos de investigación académicos, de la industria o investigadores individuales). 

Calendario
  • 25/06/2018: Datos de entrenamiento y development para S2TC, SDC y MDC
  • 30/06/2018: Datos de entrenamiento y development para SoSC
  • 24/09/2018: Fecha límite para la inscrpción
  • 21/10/2018: Fecha límite para el envío de resultados y descripción de sistemas
  • 31/10/2018: Resultados distribuidos a los participantes
  • 21-23/11/2018: Taller de evaluación en Iberspeech 2018
Número de participantes

Tareas en curso

Número de participantes de España

Tareas en curso

Dominio

Informativos, debates, programas de entretenimiento, retransmisiones deportivas

Presentaciones en las jornadas MAVIR sobre recuperación de la información, procesamiento del lenguaje natural (SoSC)

Conversaciones relacionadas con el rechazo, elogio y la disculpa habladas por no nativos con diferentes niveles en español (SoSC)

Idiomas Español (con variedades de latinoamerica).

Datos

Datos de entrenamiento

S2TC: Contenido audiovisual televisivo (informativos, debates, programas de entretenimiento, retransmisiones deportivas).

SDC y MDC: Corporación Aragonesa de Radio y Televisión (CARTV)

SoSC: TVE database, MAVIR database y COREMAH database (conversaciones relacionadas con el rechazo, elogio y la disculpa habladas por no nativos con diferentes niveles en español)

Derecho de redistribución de datos

Es posible su redistribución. Los datos de RTVE son usables con fines de investigación sin problemas. Para fines comerciales habrá que firmar un acuerdo con RTVE para su explotación y el pago de cánones que se estipule.

Enlace a datasets

Los datos están disponibles solo para los participantes de la evaluación y están sujetos a los términos de un acuerdo de licencia. El acuerdo de licencia con RTVE se puede descargar desde la página web de Cátedra RTVE-UZ

Resultados

Métrica de evaluación

Varias

Rendimiento

Tareas en curso

Disponibilidad del código

Tareas en curso

Tipo de ejecución

Local

Número total de resultados enviados

Tareas en curso

Resultados con los rankings

Tareas en curso

Volumen de publicación

Tareas en curso

Gestión web de usuarios

Tareas en curso

Atención a participantes

Email: iberspeech2018@telefonica.com