Esta versión de la guía docente es provisional hasta que no finalize el periodo de edición de las guías del nuevo curso.
Análisis de Video
Código: 44778
Créditos ECTS: 9
2025/2026
Titulación |
Tipo |
Curso |
Visión por Computador |
OB |
1 |
Equipo docente
- Javier Ruiz Hidalgo
- Ramon Morros Rubio
- Gloria Haro Ortega
- Montse Pardàs Feliu
- Federico Sukno
- Albert Clapés Sintes
Idiomas de los grupos
Puede consultar esta información al final del documento.
Prerrequisitos
Un grado en Ingeniería, Matemáticas, Física o similar.
Asignatura C3: Machine Learning for Computer Vision
Competencias en programación en Python.
Objetivos y contextualización
Coordinador del módulo: Dr. Javier Ruiz / Dr. Albert Clapès
El objetivo de este módulo es presentar los principales conceptos y tecnologías que son necesarios para el análisis de video. En primer lugar, se presentan las aplicaciones de análisis de secuencias de imágenes y los diferentes tipos de datos donde se aplicarán estas técnicas. Además se proporciona una descripción general de las técnicas de procesamiento de señales y las arquitecturas generales de aprendizaje profundo en las que se basa el análisis de video. Se darán ejemplos para secuencias de video monocámara, multicámara y cámaras de profundidad. Se estudiarán tanto las bases teóricas como los algoritmos más utilizados. Para cada materia, se presentarán técnicas clásicas junto con las técnicas de aprendizaje profundo del estado del arte que conducen a diferentes enfoques. Los temas principales serán la segmentación de video, la sustracción y modelado del fondo, la estimación de movimiento, los algoritmos de seguimiento y el análisis basado en modelos. También se estudiarán técnicas de nivel superior, como el reconocimiento de gestos o acciones, la generación profunda de de videos y el aprendizaje profundo multimodal.
Los estudiantes trabajarán en un proyecto de análisis de secuencias de vídeo. En una primera parte, se trabajará en un sistema de monitorización de tráfico aplicado a ADAS (Sistemas Avanzados de Asistencia la Conductor), en el que se aplicacarán algoritmos y models de detección de objetos, segmentación, seguimiento y estimación de flujo-óptico para vídeo. En una segunda parte, el objetivo será la detección y reconocimiento de acciones en vídeos.
Resultados de aprendizaje
- CA03 (Competencia) Definir todos los componentes que cooperan en un sistema completo de análisis de secuencias de imágenes.
- CA06 (Competencia) Conseguir los objetivos de un proyecto de visión realizado en equipo.
- KA06 (Conocimiento) Identificar los problemas básicos que se deben solucionar en un problema de secuencias de imágenes de escenas.
- KA14 (Conocimiento) Proporcionar la mejor modelización para solucionar problemas de segmentación de vídeos, de estimación del movimiento o del seguimiento de objetos.
- SA05 (Habilidad) Resolver un problema de reconocimiento visual entrenando una arquitectura de red neuronal profunda y evaluar los resultados.
- SA11 (Habilidad) Definir los mejores conjuntos de datos para entrenar arquitecturas de reconocimiento visual.
- SA15 (Habilidad) Preparar un informe que describa, justifique e ilustre el desarrollo de un proyecto de visión.
- SA17 (Habilidad) Preparar presentaciones orales que permitan debatir los resultados del desarrollo de un proyecto de visión.
Contenido
- Segmentación de vídeo
- Estimación del movimiento
- Seguimiento de objetos
- Redes Neuronales Recurrentes
- Atención y Transformers para vídeo
- Detección y Reconocimiento de acciones
- Auto-aprendizaje y aprendizaje multi-modal para vídeo.
- Adaptación al dominio para vídeo.
- Detección de anomalías
- Generación de vídeo
Actividades formativas y Metodología
Título |
Horas |
ECTS |
Resultados de aprendizaje |
Tipo: Dirigidas |
|
|
|
Sesiones teóricas |
35
|
1,4 |
CA03, CA06, KA06, KA14, SA05, SA11, SA15, SA17, CA03
|
Tipo: Supervisadas |
|
|
|
Sesiones de seguimiento de proyecto |
10
|
0,4 |
CA03, CA06, KA06, KA14, SA05, SA11, SA15, SA17, CA03
|
Tipo: Autónomas |
|
|
|
Trabajo autónomo |
171
|
6,84 |
CA03, CA06, KA06, KA14, SA05, SA11, SA15, SA17, CA03
|
Sesiones supervisadas: (Algunas de estas sesiones podrían ser en línea síncronas)
- Sesiones de teoría, donde los profesores explican contenidos generales sobre los diferentes temas. Algunos de ellos se usarán para resolver los problemas.
Sesiones dirigidas:
- Sesiones de proyecto, donde los problemas y los objectivos de los proyectos serán presentados y discutidos, los estudiantes interactuarán con el coordinador del proyecto sobre problemas y ideas para resolver el proyecto (aprox. 1 hora/semana).
- Sesión de presentación, donde los estudiantes hacen una presentación oral sobre cómo han resuelto el proyecto y una demostración de los resultados.
- Sesión de examen, donde los estudiantes son evaluados de forma individual sobre el conocimiento obtenido y las habilidades para resolver problemas.
Trabajo autónomo:
- El estudiante estudiará de forma autónoma y trabajará los materiales derivados de las sesiones teóricas.
- El estudiante trabajará en grupos para resolver los problemas del proyecto con entregas de:
- Código
- Informes
- Presentación oral
Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.
Evaluación
Actividades de evaluación continuada
Título |
Peso |
Horas |
ECTS |
Resultados de aprendizaje |
Asistencia a sesiones |
0.05 |
0,5
|
0,02 |
CA03, CA06, KA06, KA14, SA05, SA11, SA15, SA17
|
Examen |
0.4 |
2,5
|
0,1 |
CA03, KA06, KA14, SA05, SA11
|
Proyecto |
0.55 |
6
|
0,24 |
CA03, CA06, KA06, KA14, SA05, SA11, SA15, SA17
|
La Nota final de este módulo se calcula con la seguiente fórmula:
Nota final = 0.4 x Examen + 0.55 x Proyecto+ 0.05 x Asistencia
donde,
Examen: es la nota obtenida en el examen final del módulo (debe ser >= 3).
Assistencia: es la nota derivada de la asistencia a las sesiones (mínimo 70%).
Proyecto: es la nota que pone el coordinador del proyecto de acuerdo con los resultados del seguimiento semanal del proyecto y de las entregas (debe ser >= 5).. Todo de acuerdo con criterios específicos, tales como:
- Participación en les sesiones de discusión y en el trabajo en equipo (evaluación entre-miembros).
- Entrega de las partes obligatorias y opcionales del proyecto.
- Desarrollo del código (estilo, comentarios, etc.)
- Informe (justificación de las decisiones tomadas en el desarrollo del proyecto)
- Presentación (Presentación y demostración del proyecto desarrollado)
Sólo los estudiantes que han suspendido (nota final < 5.0) podran hacer el examen de recuperación.
Bibliografía
Artículos:
- M. Piccardi. “Background subtraction techniques: a review”. Journal: IEEE Int. Conf. On Systems, Man and Cybernetics 2004 , v. 4, pp. 3099-3104, 2004.
- A. Sobral, A. Vacavant, “A comprehensive review of background subtraction algorithms evaluated with synthetic and real videos”, Journal: Computer Vision and Image Understanding Vol. 122, pp. 4-21 · May 2014.
- S. Baker, D. Scharstein, JP. Lewis, S. Roth, M. Black, R. Szeliski. “A database and evaluation methodology for optical flow”. Journal: International Journal of Computer Vision, Vol. 92:1, pp. 1-31, 2011.
- T. Cootes, G. Edwards, C. Taylor. “Active appearance models”. Journal: IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 6, pp. 681--685, 2001.
- R. Poppe. “Vision-based Human motion analysis: an overview”. Journal: Computer Vision and Image Understanding 108 (1-2): 4-18, 2007
Libros:
- “Sequential Monte Carlo methods in practice”, A. Doucet, N. de Freitas and N.Gordon (Eds.), Springer, 2001.
Software
Entorno de programación en Python con especial atención a las librerías de visión por computador y Pythorch
Grupos e idiomas de la asignatura
La información proporcionada es provisional hasta el 30 de noviembre de 2025. A partir de esta fecha, podrá consultar el idioma de cada grupo a través de este enlace. Para acceder a la información, será necesario introducir el CÓDIGO de la asignatura