Logo UAB
2022/2023

Fundamentos de la Visión por Computador

Código: 106581 Créditos ECTS: 6
Titulación Tipo Curso Semestre
2504392 Inteligencia Artificial / Artificial Intelligence OB 2 1

Contacto

Nombre:
Jorge Bernal del Nozal
Correo electrónico:
jorge.bernal@uab.cat

Uso de idiomas

Lengua vehicular mayoritaria:
inglés (eng)
Algún grupo íntegramente en inglés:
Algún grupo íntegramente en catalán:
No
Algún grupo íntegramente en español:
No

Prerequisitos

No hay prerequisitos, esta asignatura es autocontenida, aunque sí que se recomienda haber superado las asignaturas de primer curso de programación.

Objetivos y contextualización

El objetivo principal de la asignatura es que el alumno conozca los aspectos básicos de la visión por computador y el procesado de imagen. Más concretamente, los objetivos se pueden resumir en:

Conocimientos:

  • Conocer y entender el proceso de captación de imágenes
  • Entender el fenómeno de la percepción visual humana
  • Comprender las fases en que se divide la solución a un problema de análisis de imágenes
  • Saber identificar las ventajas y desventajas de los algoritmos de visión por computador que se explican
  • Resolver problemas reales usando técnicas de visión por computador
  • Conocer las limitaciones de los problemas reales para decidir qué técnica de visión por computador es más apropiada
  • Saber escoger el algoritmo de procesamiento de imágenes más adecuado para realizar una tarea dada

Habilidades:

  • Saber reconocer en qué situaciones aplicar algoritmos de visión por computador puede ser apropiado para resolver un problema
  • Saber analizar el problema que hay que resolver y diseñar la solución óptima aplicando las técnicas aprendidas
  • Redactar documentos técnicos relacionados con el análisis y la solución de un problema dado
  • Programar los algoritmos básicos para solucionar los problemas propuestos
  • Evaluar los resultados obtenidos a partir de la solución implementada y valorar posibles mejoras
  • Saber razonar y defender cada una de las decisiones tomadas a la hora de llegar a una solución

Competencias y resultados de aprendizaje:

  • Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración ydefensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • Introducir cambios en los métodos y los procesos del ámbito de conocimiento para dar respuestas innovadoras a las necesidades y demandas de la sociedad.
  • Analizar una situación e identificar sus puntos de mejora.
  • Proponer nuevos métodos o soluciones alternativas fundamentadas.
  • Proponer nuevas maneras de medir el éxito o el fracaso de la implementación de propuestas o ideas innovadoras.
  • Desarrollar pensamiento crítico para analizar de forma fundamentada y argumentada alternativas y propuestas tanto propias como ajenas.
  • Trabajar cooperativamente para la consecución de objetivos comunes, asumiendo la propia responsabilidad y respetando el rol de los diferentes miembros del equipo.
  • Analizar y resolver problemas de forma efectiva, generando propuestas innovadoras y creativas para alcanzar los objetivos.
  • Conceptualizar y modelar alternativas de soluciones complejas a problemas de aplicación de la inteligencia artificial en diferentes ámbitos, y planificar y gestionar proyectos para el diseño y desarrollo de prototipos que demuestren la validez del sistema propuesto.
  • Identificar las mejores representaciones para definir descriptores de imágenes
  • Usar técnicas de procesamiento de imágenes para planificar, desarrollar, evaluar e implementar una solución a un problema particular
  • Planificar, desarrollar, evaluar e implementar una solución a un problema particular de reconocimiento visual
  • Concebir, diseñar, analizar e implementar sistemas inteligentes capaces de utilizar la visión como mecanismo para interaccionar con el entorno.
  • Identificar los conceptos básicos y aplicar de manera adecuada las técnicas de procesamiento de imágenes
  • Seleccionar las mejores técnicas de procesamiento de imágenes para la preparación de las imágenes

Competencias

  • Concebir, diseñar, analizar e implementar sistemas inteligentes capaces de utilizar la visión como mecanismo para interaccionar con el entorno.
  • Conceptualizar y modelar alternativas de soluciones complejas a problemas de aplicación de la inteligencia artificial en diferentes ámbitos, y planificar y gestionar proyectos para el diseño y desarrollo de prototipos que demuestren la validez del sistema propuesto.
  • Desarrollar pensamiento crítico para analizar de forma fundamentada y argumentada alternativas y propuestas tanto propias como ajenas.
  • Introducir cambios en los métodos y los procesos del ámbito de conocimiento para dar respuestas innovadoras a las necesidades y demandas de la sociedad.
  • Trabajar cooperativamente para la consecución de objetivos comunes, asumiendo la propia responsabilidad y respetando el rol de los diferentes miembros del equipo.

Resultados de aprendizaje

  1. Analizar una situación e identificar sus puntos de mejora.
  2. Desarrollar pensamiento crítico para analizar de forma fundamentada y argumentada alternativas y propuestas tanto propias como ajenas.
  3. Identificar las mejores representaciones para definir descriptores de imágenes.
  4. Identificar los conceptos básicos y aplicar de manera adecuada las técnicas de optimización aplicadas a las imágenes.
  5. Identificar los conceptos básicos y aplicar de manera adecuada las técnicas de procesamiento de imágenes.
  6. Planificar, desarrollar, evaluar e implementar una solución a un problema particular de reconocimiento visual.
  7. Seleccionar las mejores técnicas de optimización para la extracción de características relevantes en imágenes.
  8. Seleccionar las mejores técnicas de procesamiento de imágenes para la preparación de las imágenes.
  9. Trabajar cooperativamente para la consecución de objetivos comunes, asumiendo la propia responsabilidad y respetando el rol de los diferentes miembros del equipo.
  10. Usar técnicas de optimización para planificar, desarrollar, evaluar e implementar una solución a un problema particular.
  11. Usar técnicas de procesamiento de imágenes para planificar, desarrollar, evaluar e implementar una solución a un problema particular.

Contenido

  1. Introducción a la visión por computador
    1. Modelo de Marr
    2. Sistema Visual Humano
  2. Formación de imagen digital
    1. Conceptos d luz, escena, colores
    2. Ópticas y cámaras
  3. Procesado de imágenes
    1. Muestreo
    2. Cuantificación
    3. Tipos de imágenes
  4. Filtrado
    1. Filtrado lineal (Sistemas Lineales, Transformada de Fourier)
    2. Filtrado no lineal (Morfología matemática)
  5. Extracción de características
    1. Edges
    2. Corners
    3. Blobs
  6. Descriptores de características
    1. Color
    2. Textura
    3. Forma
  7. Introducción a problemas básicos de visión por computador
    1. Detección
    2. Segmentación
    3. Clasificación
    4. Problema completo usando Bag of Words

Metodología

Las diferentes actividades de la asignatura se organizan de la siguiente manera. Cada semana los estudiantes tendrán 4 horas de clase donde se compaginarán breves explicaciones teóricas con la realización de pequeños casos prácticos. No habrá clases específicas dedicadas exclusivamente a clase magistral o clase de problemas, la intención es que se trabajen determinados conceptos acotados de principio a fin en cada una de las clases.

Una vez acabado un bloque principal de temas, se llevará a cabo un proyecto de duración corta (una o dos semanas) que servirá para afianzar los contenidos y preparar las actividades de evaluación individuales.

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.

Actividades

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clase de Teoría y Problemas 26 1,04 1, 2, 5, 4, 3, 8, 7, 11, 10
Tipo: Supervisadas      
Realización de proyectos 8 0,32 1, 2, 5, 4, 3, 6, 8, 7, 9, 11, 10
Resolución de pequeños problemas en clase 10 0,4 1, 5, 4, 3, 6, 8, 7, 11, 10
Tipo: Autónomas      
Estudio de la materia 53 2,12 1, 5, 4, 3, 6, 8, 7, 11, 10
Realización de las prácticas en grupo 21 0,84 1, 2, 5, 4, 3, 6, 8, 7, 9, 11, 10
Realización de problemas en casa 20 0,8 1, 5, 4, 3, 6, 8, 7, 11, 10

Evaluación

Se seguirá un procedimiento de evaluación continua, donde cada actividad realizada a lo largo del curso contribuye a a la nota final.

La nota final se calcula de la siguiente manera:

  • Nota final: 0.4*Nota_teoria + 0.4*Nota_proyectos + 0.1*Nota_problemas + 0.1*Nota_seguimiento

En cuanto a la nota de teoría, se calcula de la siguiente manera:

  • Nota_teoria: 0.5*Nota_Parcial1 + 0.5*Nota_Parcial2
  • Aprobar (nota mayor que 5) cada uno de los parciales supone eliminar materia
  • Es necesario sacar un 5 como nota final de teoría para superar la asignatura.

Respecto a la nota de proyectos, se calcula de la siguiente manera:

  • Nota_proyectos: 0.4*Nota_Proyecto1 + 0.6*Nota_Proyecto2
  • En la nota de cada proyecto se tendrá en cuenta tanto la calidad de los resultados obtenidos como la habilidad de los estudiantes para presentarlos y defenderlos en público
  • Es necesario sacar un 5 en cada uno de los proyectos para superar la asignatura.

En cuanto a la nota de problemas, se calcula como una media de las notas de los diferentes problemas cortos entregados a lo largo del curso. Finalmente, la nota de seguimiento se basará en pequeñas actividades que se harán durante las clases para comprobar el grado de asimilación de los conocimientos (Kahoot! o similares).

Todas las actividades con mínimos necesarios para superar la asignatura (teoría y proyecto) contarán con una segunda oportunidad para recuperar nota.

Sin perjuicio de otras medidas disciplinarias que se estimen oportunas, y de acuerdo con la normativa académica vigente, las irregularidades cometidas por un estudiante que puedan conducir a una variación de la calificación se calificarán con un cero (0). Las actividades de evaluación calificadas de esta forma y por este procedimiento no serán recuperables. Si es necesario superar cualquiera de estas actividades de evaluación para aprobar la asignatura, esta asignatura quedará suspendida directamente, sin oportunidad de recuperarla en el mismo curso. Estas irregularidades incluyen, entre otros:

    - la copia total o parcial de una práctica, informe, o cualquier otra actividad de evaluación;

    - dejar copiar;

    - presentar un trabajo de grupo no hecho íntegramente por los miembros del grupo;

    - presentar como propios materiales elaborados por un tercero, aunque sean traducciones o adaptaciones, y en general trabajos con elementos no originales y exclusivos del estudiante;

    - tener dispositivos de comunicación (como teléfonos móviles, smart watches, etc.) accesibles durante las pruebas de evaluación teórico-prácticas individuales (exámenes).

    La nota numérica del expediente será el valor menor entre 3.0 y la media ponderada de las notas en caso de que el estudiante haya cometido irregularidades en un acto de evaluación (y por tanto no será posible el aprobado por compensación).

    En resumen: copiar, dejar copiar o plagiar en cualquiera de las actividades de evaluación equivale a un SUSPENSO con nota inferior a 3.5.

Actividades de evaluación

Título Peso Horas ECTS Resultados de aprendizaje
Evaluación de prácticas Ver actividades e instrumentos de evaluación 4 0,16 1, 2, 5, 4, 3, 6, 8, 7, 9, 11, 10
Examen final Ver actividades e instrumentos de evaluación 3 0,12 1, 2, 5, 4, 3, 6, 8, 7, 9, 11, 10
Primer Parcial Teoría Ver activitades e instrumentos de evaluación 2,5 0,1 5, 4, 8, 11, 10
Segundo parcial teoría Ver activitades e instrumentos de evaluación 2,5 0,1 1, 4, 3, 6, 7, 10

Bibliografía

  • Simon J.D. Prince, Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2012.(http://www.computervisionmodels.com/)
  • David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach (2nd Edition), Prentice Hall 2011.
  • Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing (3rd Edition), Prentice Hall 2007.
  • Richard Szeliski, Computer Vision: Algorithms and Applications, Springer (Texts in computer Science) 2011. (http://szeliski.org/Book/)
  • Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)
  • Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.

Cursos online:

Software

Se usará el siguiente software en la asignatura:

  • MatLab
  • Python

Toda la comunicación con los estudiantes se hará mediante el Campus Virtual de la UAB