Video Processing and Understanding Lab
Universidad Autónoma de Madrid, Escuela Politécnica Superior

SARADL 2015/ASIA/12 (2015-2016)
Sistema de Análisis de vídeo para Reconocimiento de Actividades basado en técnicas de aprendizaje automático Deep Learning

Financiado por
Convocatoria de proyectos de cooperación interuniversitaria
UAM-Banco Santander con Asia (2015)

Resumen del proyecto

Este proyecto se enmarca en el área de Tecnologías de la Información y de las Comunicaciones y se centra en el reconocimiento de acciones y actividades de personas en secuencias de vídeo. Este campo es de gran interés en múltiples contextos como vídeo-seguridad, biometría, robótica y medicina. Aunque intuitivo, esta tarea es compleja debido a la variabilidad del movimiento humano y las condiciones de captura del vídeo. El principal problema existente es la alta depedencia de los resultados con el diseño del algoritmo, en gran medida limitando su uso los contextos anteriormente mencionados. Por otro lado, el campo del aprendizaje automático ha tenido un gran crecimiento reciente debido al paradigma deep learning que obtiene abstracciones de alto nivel sobre un conjunto de datos para realizar un razonamiento similar al cerebro humano. Su efectividad queda demostrada por su uso en varios dominios (reconocimiento de voz, procesado del lenguaje natural y aplicaciones médicas) y ha sido adoptada por empresas tecnologicas como tecnología principal en sus sistemas comerciales (p.e. Google, Facebook, Microsoft, Baidu).

La propuesta de proyecto pretende combinar los conocimientos y recursos de las entidades participantes: el equipo investigador dirigido por el Prof. Shuqiang Jiang, perteneciente al Institute of Computing Technology (Beijing, China) aporta algoritmos deep learning aplicados a imágenes estáticas; la Universidad Autonoma de Madrid por medio del grupo VPULab aporta las técnicas de reconocimiento de acciones en vídeo. El objetivo de esta propuesta es el desarrollo de un prototipo software/hardware para un sistema automático de reconocimiento de acciones y actividades de personas en vídeo utilizando deep learning.

En esta página web podrá descargar parte del material generado en este proyecto de colaboración.

Documentos

Informes técnicos

Ponencias realizadas

Software

Todos los paquetes listados a continuación incluyen implementaciones de algoritmos del estado del arte basados en deep learning. Este software está disponible para uso no comercial y no podrá ser modificado/distribuido sin permiso del autor. Si está interesado por favor envíe un email a juancarlos[dot]sanmiguel[at]uam[dot]es

  • Marco de evaluación para algoritmos de inicialización de fondo (MATLAB )
  • Marco de evaluación para algoritmos de seguimiento de objetos (MATLAB )
  • Marco de evaluación para algoritmos de reconocimiento de acciones (MATLAB )
  • Detección de personas utilizando contexto de la escena (C++, OpenCV )
  • Simulador virtual basado en Unity para sistemas multi-cámara distribuidos (C++, OpenCV ,Unity )

Trabajos académicos relacionados

  • Reconocimiento de actividades utilizando información de color y profundidad, Borja Olmo Esteban (advisor: Juan C. SanMiguel), Proyecto Fin de Carrera (Master Thesis), Ingeniería de Telecomunicación, Univ. Autónoma de Madrid, Julio 2016.
  • Detección de personas utilizando contexto de la escena, Carlos Chaparro Pozo (advisor: Álvaro García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, Julio 2016.
  • Simulador virtual basado en Unity para sistemas multi-cámara distribuidos, Mario Gonzalez Jimenez (advisor: Juan C. San Miguel), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática, Univ. Autónoma de Madrid, Febrero 2016.
  • Detección de personas mediante redes convolucionales, Esther Sanchez (advisor: Álvaro García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, en curso de realización
  • Plataforma de evaluación de algoritmos de detección de personas, Anthony Brian (advisor: Álvaro García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, en curso de realización
  • Seguimiento de objetos basado en múltiples características, Guillermo Luna Aguado, (advisor: Juan C. SanMiguel), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, en curso de realización
Last update 27/01/2017
Universidad Autónoma de Madrid, Escuela Politécnica Superior
Video Processing and Understanding Lab