Logo UAB
2021/2022

Visión por Computador

Código: 104423 Créditos ECTS: 6
Titulación Tipo Curso Semestre
2503740 Matemática Computacional y Analítica de Datos OT 4 2
La metodología docente y la evaluación propuestas en la guía pueden experimentar alguna modificación en función de las restricciones a la presencialidad que impongan las autoridades sanitarias.

Contacto

Nombre:
Felipe Lumbreras Ruíz
Correo electrónico:
Felipe.Lumbreras@uab.cat

Uso de idiomas

Lengua vehicular mayoritaria:
español (spa)
Algún grupo íntegramente en inglés:
No
Algún grupo íntegramente en catalán:
No
Algún grupo íntegramente en español:

Otras observaciones sobre los idiomas

algunos materiales docentes son en catalán, castellano e inglés

Prerequisitos

No hay prerrequisitos. Esta asignatura es bastante autocontenida. Sin embargo, en esta asignatura se tocarán temas relacionados con cálculo matemático, probabilidad y teoría de la señal, por otro lado, problemas y prácticas en muchos casos serán pequeños programas, por lo que se necesita una buena base en matemáticas y en programación.

Objetivos y contextualización

Los objetivos de la asignatura se pueden resumir en:

Conocimientos:

    Conocer, entender y saber modelar la adquisición con diferentes sensores, especialmente con cámaras.
    Describir y relacionar las fases en que se divide la solución a un problema de análisis de procesamiento de la señal.
    Identificar las ventajas e inconvenientes de los algoritmos de procesamiento de imágenes.
    Resolver problemas reales relacionados con técnicas de procesamiento de imágenes.
    Entender el resultado y las limitaciones de las técnicas de visión en diferentes casos de estudio.
    Saber escoger el algoritmo de procesamiento de imágenes más adecuado para solucionar una tarea dada.
    Saber elegir las técnicas de visión por computador más adecuadas para solucionar problemas contextualizados.

Habilidades:

    Reconocer las situaciones en las que la aplicación de algoritmos de procesamiento de imágenes puede ser adecuada para solucionar un problema.
    Analizar el problema a resolver y diseñar la solución óptima aplicando las técnicas aprendidas.
    Redactar documentos técnicos relacionados con el análisis y la solución de un problema.
    Programar los algoritmos básicos para solucionar los problemas propuestos.
    Evaluar los resultados de la solución implementada y valorar las posibles mejoras.
    Defender y argumentar las decisiones tomadas en la solución de los problemas propuestos.

Competencias

  • Evaluar de manera crítica y con criterios de calidad el trabajo realizado.
  • Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
  • Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • Resolver problemas relacionados con el análisis de grandes volúmenes de datos a través del diseño de sistemas inteligentes y de aprendizaje computacional.
  • Trabajar cooperativamente en un contexto multidisciplinar asumiendo y respetando el rol de los diferentes miembros del equipo.
  • Utilizar eficazmente bibliografía y recursos electrónicos para obtener información.

Resultados de aprendizaje

  1. Aplicar los métodos básicos de procesamiento de imágenes a problemas específicos.
  2. Desarrollar aplicaciones de visión por computador para solucionar problemas básicos de análisis de imágenes y vídeo.
  3. Evaluar de manera crítica y con criterios de calidad el trabajo realizado.
  4. Extraer los descriptores de forma de los objetos presentes en una escena.
  5. Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
  6. Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  7. Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  8. Trabajar cooperativamente en un contexto multidisciplinar asumiendo y respetando el rol de los diferentes miembros del equipo.
  9. Utilizar eficazmente bibliografía y recursos electrónicos para obtener información.

Contenido

1.  Introducción al tratamiento de la señal, imagen y vídeo
2.  Formación de la imagen
3.  Procesamiento de imágenes
4.  Filtrado lineal (espacial)
5.  Filtrado frecuencial
6.  Filtrado no lineal
7.  Transformaciones geométricas
8.  Segmentación
9.  Características
10. Clasificación
11. Miscelánea (aplicaciones, movimiento)
12. Deep Learning

Metodología

Las diferentes actividades que se llevarán a cabo en la asignatura se organizan de la siguiente manera:

Clases magistrales

Se expondrán los principales conceptos y algoritmos de cada tema de teoría. Estos temas suponen el punto de partida en el trabajo de la asignatura.

Seminarios de problemas

Serán clases con grupos reducidos de estudiantes que faciliten la interacción. En estas clases se plantearán casos prácticos que requieran el diseño de una solución en la que se utilicen los métodos vistos en las clases de teoría.

Prácticas de laboratorio

Habrá una serie de prácticas comunes que permitirán alcanzar unas competencias básicas en temas de visión. Una primera entrega fuera de horas de laboratorio para conocer las herramientas. Tres prácticas temáticas relacionadas estrechamente con la teoría que se está dando a la vez o previa. Finalmente un proyecto elegido por los mismos alumnos. En la segunda parte del semestre deberán analizar este problema, diseñar e implementar soluciones basadas en diferentes algoritmos de procesamiento y visión vistos en clase, analizar los resultados obtenidos en cada uno de los métodos, defender su solución y hacer la presentación en público de los resultados .

Los grupos de trabajo estarán formados por grupos de 2 a 3 alumnos y deberán formar la segunda semana del curso. Estos grupos de trabajo se deberán mantener hasta el final del curso y deberán autogestionar: reparto de roles, planificación del trabajo, asignación de tareas, gestión de los recursos disponibles, conflictos, etc. Aunque el profesor guiará el proceso de aprendizaje, su intervención en la gestión de los grupos será mínima.

Para desarrollar el proyecto, los grupos trabajarán de forma autónoma y las sesiones de prácticas se dedicarán principalmente a resolver dudas con el profesor que hará el seguimiento del estado del proyecto, indicará errores a corregir, propondrá mejoras, etc.

Algunas de las sesiones se marcarán como sesiones de control donde se deberá entregar una práctica. En estas sesiones los grupos deberán explicar el trabajo hecho y el profesor hará cuestiones a todos los miembros del grupo para valorar el trabajo realizado. La asistencia a estas sesiones es obligatoria.

En la entrega final los grupos harán una presentación del proyecto donde explicarán el proyecto desarrollado, la solución adoptada y los resultados obtenidos. En esta presentación cada miembro del grupo deberá hacer una parte de la presentación.

El código de las prácticas comunes se desarrollará en lenguaje Matlab y python. La parte del proyecto será libre a elegir por los alumnos.

A pesar de lo que se diga en la guía y al estar en los primeros años de vida de esta asignatura se pueden aplicar cambios sobre la marcha que mejoren y adapten la metodología a la nueva asignatura.

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.

Actividades

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clase magistral 20 0,8 1, 3, 2, 4, 5, 7, 8
Prácticas de laboratorio 10 0,4 1, 2, 4, 5, 6, 7, 8, 9
Seminario de problemas 11,5 0,46 1, 2, 4, 5, 6, 7, 9
Tipo: Supervisadas      
Análisis y diseño del proyecto 12 0,48 1, 3, 2, 4, 5, 6, 7, 8, 9
Documentación del proyecto 6 0,24 2, 5, 6, 7, 8, 9
Tipo: Autónomas      
Estudio personal 45 1,8 1, 3, 2, 4, 5, 6, 7, 9
Presentación oral 12 0,48 3, 5, 6, 7, 8
Programación del proyecto 25 1 1, 3, 2, 4, 5, 6, 7, 8, 9

Evaluación

Actividades e instrumentos de evaluación:

Evaluación continua. El alumno ve en todo momento su evolución a la asignatura y como se alcanzan los diferentes objetivos tanto de prácticas como de problemas y teoría.

- Conocimientos teóricos

La nota final de teoría se calculará a partir de la nota de dos pruebas:

               Nota Teoría = 0.5 Bloque 1 + 0.5 Bloc2

Estas pruebas pretenden una evaluación individualizada del estudiante con sus capacidades de resolver problemas utilizando las técnicas explicadas en clase así como evaluar el nivel de conceptualización que el estudiante ha hecho de las técnicas vistas.

Recuperación (teoría). Si el alumno quiere subir nota o recuperar puede presentarse al examen final dividido también en dos bloques.

- Problemas

Los problemas serán evaluados junto con las pruebas de teoría, ya que los problemas complementan la teoría. La recuperación de esta parte se hará junto con la teoría. Examen de recuperación.
Recuperación (problemas). Si el alumno quiere subir nota o recuperar puede presentarse al examen final dividido también en dos bloques.

              Nota de Problemas = 0.5 Bloque 1 + 0.5 Bloc2

- Prácticas

La parte práctica es una serie de pequeños proyectos. La evaluación de esta parte incluirá:

    Evaluación individual del Lab0 que introduce las herramientas de trabajo que se utilizarán en las prácticas. También las partes de exposición del proyecto final son evaluadas de forma individual.
    Evaluación conjunta de las prácticas: nota única para todos los miembros del grupo de trabajo que valorará los resultados obtenidos y la calidad del código.
    Evaluación del proyecto que valorará, los objetivos alcanzados tanto por el grupo como individualmente, los resultados obtenidos y la presentación.

La nota de esta parte se calculará según la fórmula:

            Nota Prácticas = (1/20) Lab0 + (3/20) Lab1 + (3/20) Lab2 + (3/20) Lab3 + (10/20) Proyecto

Recuperación (prácticas). La recuperación de esta parte consistirá en la entrega del material no entregado antes pero con un factor de penalización multiplicativo de 0.8.

- Evaluación final

La Nota Final de la asignatura se obtiene combinando la evaluación de estas actividades de la siguiente forma:

            Nota Final = 0.3 Nota Teoría + 0.3 Nota Problemas + 0.4 Nota Prácticas

La nota final que aparecerá en el expediente salvo casos particulares de copia y plagios o "No evaluable" será el resultado de aplicar la fórmula Nota final, también por los casos de suspenso.

Las matrículas de honor (MH) se darán a las personas con mejor nota que superen el 9 por orden de llegada a esta nota y se darán tantas como se puedan dar por la ratio de matriculados.

Condiciones:

Si el alumno se presenta a un examen parcial o si se presenta a una sesión de control de prácticas, ya no podrá ser evaluado como "No evaluable" en caso de que no se presente a las otras evaluaciones, sino que se le calculará la nota final a partir de aquellas evaluaciones continuadas a que se haya presentado.

Aclaraciones:

    No hay notas mínimas en ninguna de las evaluaciones excepto en la final. La nota para aprobar la asignatura es 5.0.

    En el caso de los estudiantes repetidores, las prácticas del año anterior, si se mantiene la temática, se pueden volver a presentar. Esto no significa una convalidación directa sino que se han de volver a defender en una única entrevista con el profesor de prácticas. El resto de actividades de evaluación (teoría y problemas) se tienen que volver a evaluar de la manera establecida.

    Las fechas de evaluación continua y entrega de trabajos se publicarán en la página web de la asignatura y en Caronte y pueden estar sujetos a cambios de programación por motivos de adaptación a posibles incidencias; siempre se informará en la página web de la asignatura y en Caronte sobre estos cambios, ya que se entiende que la página web de la asignatura y Caronte son los mecanismos habituales de intercambio de información entre profesor y estudiantes.

    Para cada actividad de evaluación, se indicará un lugar, fecha y hora de revisión en la que el estudiante podrá revisar la actividad con el profesor. En este contexto, se podrán hacer reclamaciones sobre la nota de la actividad, que serán evaluadas por el profesorado responsable de la asignatura. Si el estudiante no se presenta en esta revisión, no se revisará posteriormente esta actividad.

    Sin perjuicio de otras medidas disciplinarias que se estimen oportunas, y de acuerdo con la normativa académica vigente, las irregularidades cometidas por un estudiante que puedan conducir a una variación de la calificación se calificarán con un cero (0). Las actividades de evaluación calificadas de esta formay por este procedimiento no serán recuperables. Si es necesario superar cualquiera de estas actividades de evaluación para aprobar la asignatura, esta asignatura quedará suspendida directamente, sin oportunidad de recuperarla en el mismo curso. Estas irregularidades incluyen, entre otros:
    - la copia total o parcial de una práctica, informe, o cualquier otra actividad de evaluación;
    - dejar copiar;
    - presentar un trabajo de grupo no hecho íntegramente por los miembros del grupo;
    - presentar como propios materiales elaborados por un tercero, aunque sean traducciones o adaptaciones, y en general trabajos con elementos no originales y exclusivos del estudiante;
    - tener dispositivos de comunicación (como teléfonos móviles, smart watches, etc.) accesibles durante las pruebas de evaluación teórico-prácticas individuales (exámenes).
    La nota numérica del expediente será el valor menor entre 3.0 y la media ponderada de las notas en caso de que el estudiante haya cometido irregularidades en un acto de evaluación (y por tanto no será posible el aprobado por compensación).
    En resumen: copiar, dejar copiar o plagiar en cualquiera de las actividades de evaluación equivale a un SUSPENSO con nota inferior a 3.0.

Actividades de evaluación

Título Peso Horas ECTS Resultados de aprendizaje
Evaluación grupal 10 0,25 0,01 1, 3, 2, 4, 6, 7
Individual theoretical tests 60 6 0,24 1, 3, 2, 4, 5, 6, 7, 9
Presentación del proyecto 10 0,25 0,01 1, 3, 2, 4, 5, 6, 7, 8
Prácticas 20 2 0,08 1, 3, 2, 4, 5, 6, 7, 8, 9

Bibliografía

    Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing (3rd Edition), Prentice Hall 2007.
    Simon J.D. Prince, Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2012.(http://www.computervisionmodels.com/)
    David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach (2nd Edition), Prentice Hall 2011.
    Richard Szeliski, Computer Vision: Algorithms and Applications, Springer (Texts in computer Science) 2011. (http://szeliski.org/Book/)
    Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)
    Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.
    Joan Serrat, Llibre d'apunts de Processament d'imatges, 2006. (libro)

Cursos similares y complementarios online

    Curso online (MOOC Coursera): Image and video processing: From Mars to Hollywood with a stop at the hospital. (https://www.coursera.org/course/images)
    Curso online (MOOC Coursera): Detección de objetos (UAB). (https://www.coursera.org/learn/deteccion-objetos)
    Curso online (MOOC Coursera): Fundamentos del Procesamiento de Vídeo e Imagen Digital. (https://www.coursera.org/course/digital)
    Curso online (MOOC Coursera): Clasificación de imágenes: ¿cómo reconocer el contenido de una imagen? (UAB). (https://www.coursera.org/learn/clasificacion-imagenes)
    Curso online (MOOC Edx ): Introducción a la visión por computador: desarrollo de aplicaciones con OpenCV. (https://www.edx.org/course/introduccion-la-vision-por-computador-uc3mx-isa-1x)
    Curso online (MOOC Udacity ): Computational Photography.(https://eu.udacity.com/course/computational-photography--ud955)
    Curso online (MOOC Coursera): Machine Learning. (https://es.coursera.org/learn/machine-learning)

Software

MatLab

Python