Logo UAB

Fundamentos de la Visión por Computador

Código: 106581 Créditos ECTS: 6
2024/2025
Titulación Tipo Curso
2504392 Inteligencia Artificial / Artificial Intelligence OB 2

Contacto

Nombre:
Jorge Bernal del Nozal
Correo electrónico:
jorge.bernal@uab.cat

Idiomas de los grupos

Puede consultar esta información al final del documento.


Prerrequisitos

No hay prerequisitos, esta asignatura es autocontenida, aunque sí que se recomienda haber superado las asignaturas de primer curso de programación.


Objetivos y contextualización

El objetivo principal de la asignatura es que el alumno conozca los aspectos básicos de la visión por computador y el procesado de imagen. Más concretamente, los objetivos se pueden resumir en:

Conocimientos:

  • Conocer y entender el proceso de captación de imágenes
  • Entender el fenómeno de la percepción visual humana
  • Comprender las fases en que se divide la solución a un problema de análisis de imágenes
  • Saber identificar las ventajas y desventajas de los algoritmos de visión por computador que se explican
  • Resolver problemas reales usando técnicas de visión por computador
  • Conocer las limitaciones de los problemas reales para decidir qué técnica de visión por computador es más apropiada
  • Saber escoger el algoritmo de procesamiento de imágenes más adecuado para realizar una tarea dada

Habilidades:

  • Saber reconocer en qué situaciones aplicar algoritmos de visión por computador puede ser apropiado para resolver un problema
  • Saber analizar el problema que hay que resolver y diseñar la solución óptima aplicando las técnicas aprendidas
  • Redactar documentos técnicos relacionados con el análisis y la solución de un problema dado
  • Programar los algoritmos básicos para solucionar los problemas propuestos
  • Evaluar los resultados obtenidos a partir de la solución implementada y valorar posibles mejoras
  • Saber razonar y defender cada una de las decisiones tomadas a la hora de llegar a una solución

Competencias y resultados de aprendizaje:

  • Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración ydefensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • Introducir cambios en los métodos y los procesos del ámbito de conocimiento para dar respuestas innovadoras a las necesidades y demandas de la sociedad.
  • Analizar una situación e identificar sus puntos de mejora.
  • Proponer nuevos métodos o soluciones alternativas fundamentadas.
  • Proponer nuevas maneras de medir el éxito o el fracaso de la implementación de propuestas o ideas innovadoras.
  • Desarrollar pensamiento crítico para analizar de forma fundamentada y argumentada alternativas y propuestas tanto propias como ajenas.
  • Trabajar cooperativamente para la consecución de objetivos comunes, asumiendo la propia responsabilidad y respetando el rol de los diferentes miembros del equipo.
  • Analizar y resolver problemas de forma efectiva, generando propuestas innovadoras y creativas para alcanzar los objetivos.
  • Conceptualizar y modelar alternativas de soluciones complejas a problemas de aplicación de la inteligencia artificial en diferentes ámbitos, y planificar y gestionar proyectos para el diseño y desarrollo de prototipos que demuestren la validez del sistema propuesto.
  • Identificar las mejores representaciones para definir descriptores de imágenes
  • Usar técnicas de procesamiento de imágenes para planificar, desarrollar, evaluar e implementar una solución a un problema particular
  • Planificar, desarrollar, evaluar e implementar una solución a un problema particular de reconocimiento visual
  • Concebir, diseñar, analizar e implementar sistemas inteligentes capaces de utilizar la visión como mecanismo para interaccionar con el entorno.
  • Identificar los conceptos básicos y aplicar de manera adecuada las técnicas de procesamiento de imágenes
  • Seleccionar las mejores técnicas de procesamiento de imágenes para la preparación de las imágenes

Competencias

  • Concebir, diseñar, analizar e implementar sistemas inteligentes capaces de utilizar la visión como mecanismo para interaccionar con el entorno.
  • Conceptualizar y modelar alternativas de soluciones complejas a problemas de aplicación de la inteligencia artificial en diferentes ámbitos, y planificar y gestionar proyectos para el diseño y desarrollo de prototipos que demuestren la validez del sistema propuesto.
  • Desarrollar pensamiento crítico para analizar de forma fundamentada y argumentada alternativas y propuestas tanto propias como ajenas.
  • Introducir cambios en los métodos y los procesos del ámbito de conocimiento para dar respuestas innovadoras a las necesidades y demandas de la sociedad.
  • Trabajar cooperativamente para la consecución de objetivos comunes, asumiendo la propia responsabilidad y respetando el rol de los diferentes miembros del equipo.

Resultados de aprendizaje

  1. Analizar una situación e identificar sus puntos de mejora.
  2. Desarrollar pensamiento crítico para analizar de forma fundamentada y argumentada alternativas y propuestas tanto propias como ajenas.
  3. Identificar las mejores representaciones para definir descriptores de imágenes.
  4. Identificar los conceptos básicos y aplicar de manera adecuada las técnicas de optimización aplicadas a las imágenes.
  5. Identificar los conceptos básicos y aplicar de manera adecuada las técnicas de procesamiento de imágenes.
  6. Planificar, desarrollar, evaluar e implementar una solución a un problema particular de reconocimiento visual.
  7. Seleccionar las mejores técnicas de optimización para la extracción de características relevantes en imágenes.
  8. Seleccionar las mejores técnicas de procesamiento de imágenes para la preparación de las imágenes.
  9. Trabajar cooperativamente para la consecución de objetivos comunes, asumiendo la propia responsabilidad y respetando el rol de los diferentes miembros del equipo.
  10. Usar técnicas de optimización para planificar, desarrollar, evaluar e implementar una solución a un problema particular.
  11. Usar técnicas de procesamiento de imágenes para planificar, desarrollar, evaluar e implementar una solución a un problema particular.

Contenido

  1. Introducción a la visión por computador
    1. Modelo de Marr
    2. Sistema Visual Humano
  2. Formación de imagen digital
    1. Conceptos d luz, escena, colores
    2. Ópticas y cámaras
  3. Procesado de imágenes
    1. Muestreo
    2. Cuantificación
    3. Tipos de imágenes
  4. Filtrado
    1. Filtrado lineal (Sistemas Lineales, Transformada de Fourier)
    2. Filtrado no lineal (Morfología matemática)
  5. Extracción de características
    1. Edges
    2. Corners
    3. Blobs
  6. Descriptores de características
    1. Color
    2. Textura
    3. Forma
  7. Introducción a problemas básicos de visión por computador
    1. Detección
    2. Segmentación
    3. Clasificación
    4. Problema completo usando Bag of Words

Actividades formativas y Metodología

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clase de Teoría y Problemas 26 1,04 1, 2, 4, 5, 3, 8, 7, 10, 11
Tipo: Supervisadas      
Realización de proyectos 8 0,32 1, 2, 4, 5, 3, 6, 8, 7, 10, 11, 9
Resolución de pequeños problemas en clase 10 0,4 1, 4, 5, 3, 6, 8, 7, 10, 11
Tipo: Autónomas      
Estudio de la materia 53 2,12 1, 4, 5, 3, 6, 8, 7, 10, 11
Realización de las prácticas en grupo 21 0,84 1, 2, 4, 5, 3, 6, 8, 7, 10, 11, 9
Realización de problemas en casa 20 0,8 1, 4, 5, 3, 6, 8, 7, 10, 11

Las diferentes actividades de la asignatura se organizan de la siguiente manera. Cada semana los estudiantes tendrán 4 horas de clase donde se compaginarán breves explicaciones teóricas con la realización de pequeños casos prácticos. No habrá clases específicas dedicadas exclusivamente a clase magistral o clase de problemas, la intención es que se trabajen determinados conceptos acotados de principio a fin en cada una de las clases.

Una vez acabado un bloque principal de temas, se llevará a cabo un proyecto de duración corta (una o dos semanas) que servirá para afianzar los contenidos y preparar las actividades de evaluación individuales.

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.


Evaluación

Actividades de evaluación continuada

Título Peso Horas ECTS Resultados de aprendizaje
Evaluación de prácticas Ver actividades e instrumentos de evaluación 4 0,16 1, 2, 4, 5, 3, 6, 8, 7, 10, 11, 9
Examen final Ver actividades e instrumentos de evaluación 3 0,12 1, 2, 4, 5, 3, 6, 8, 7, 10, 11, 9
Primer Parcial Teoría Ver activitades e instrumentos de evaluación 2,5 0,1 4, 5, 8, 10, 11
Segundo parcial teoría Ver activitades e instrumentos de evaluación 2,5 0,1 1, 4, 3, 6, 7, 10

Se seguirá un procedimiento de evaluación continua, donde cada actividad realizada a lo largo del curso contribuye a la nota final. Esta asignatura no prevé el sistema de evaluación única

La nota final se calcula de la siguiente manera:
• Nota final: 0,5*nota_teoría + 0,5*nota_proyectos
En cuanto a la nota de teoría, se calcula de la siguiente manera:
• Teoría_nota: 0,5*Nota_Parcial1 + 0,5*Nota_Parcial2
• La aprobación (nota superior a 5) de cada uno de los exámenes parciales implica que el estudiante no volverá a presentarse a examen de esta parte de la asignatura. En caso contrario, el estudiante deberá presentarse al examen de recuperación.
• Es necesario obtener un 5 como nota final de teoría para aprobar la asignatura.
En cuanto a la nota del proyecto, se calcula de la siguiente manera:
• Proyectos_notas: 0.2*Proyecto_1 + 0.2*Proyecto_2 + 0.2*Proyecto_3 + 0.4*Proyecto_Nota_Final (Bolsa de palabras)
• La calificación de cada proyecto tendrá en cuenta tanto la calidad de los resultados obtenidos como la capacidad de los estudiantes para presentarlos y defenderlos en público.
• Es necesario obtener un 5 en cada uno de los proyectos para aprobar la asignatura.

Todas las actividades con el mínimo necesario para aprobar la asignatura (teoría y proyecto) tendrán una segunda oportunidad para recuperar la nota.
Sin perjuicio de otras medidas disciplinarias que se consideren oportunas, y de acuerdo con la normativa académica vigente, las irregularidades cometidas por un estudiante que puedan dar lugar a una variación de la calificación se calificarán con un cero (0). Las actividades de evaluación calificadas de esta forma y por este procedimiento no serán recuperables. Si fuera necesario superar alguna de estas actividades de evaluación para aprobar la asignatura, ésta quedará suspendida directamente, sin posibilidad de recuperarla en el mismo curso.

Estas irregularidades incluyen, entre otras:

- la copia total o parcial de una práctica, informe o cualquier otra actividad de evaluación;
- permitir la copia;
- presentar un trabajo grupal no realizado íntegramente por los miembros del grupo;
- presentar como propios materiales elaborados por un tercero, incluso si se trata de traducciones o adaptaciones, y en general trabajos con elementos no originales y exclusivos del estudiante;
- disponer de dispositivos de comunicación (como teléfonos móviles, relojes inteligentes, etc.) accesibles durante las pruebas de evaluación teórico-prácticas individuales (exámenes).
La calificación numérica del expediente será el valor menor entre 3,0 y el promedio ponderado de las calificaciones en caso de que el estudiante haya cometido irregularidades en un acto de evaluación (y por tanto no podrá aprobar para compensación).
En definitiva: copiar, permitir copiar o plagiar en cualquiera de las actividades de evaluación equivale a un SUSPENSO con una nota inferior a 3,5.


Bibliografía

  • Simon J.D. Prince, Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2012.(http://www.computervisionmodels.com/)
  • David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach (2nd Edition), Prentice Hall 2011.
  • Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing (3rd Edition), Prentice Hall 2007.
  • Richard Szeliski, Computer Vision: Algorithms and Applications, Springer (Texts in computer Science) 2011. (http://szeliski.org/Book/)
  • Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)
  • Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.

Cursos online:


Software

Se usará el siguiente software en la asignatura:

  • Python

Toda la comunicación con los estudiantes se hará mediante el Campus Virtual de la UAB


Lista de idiomas

Nombre Grupo Idioma Semestre Turno
(PAUL) Prácticas de aula 711 Inglés primer cuatrimestre tarde
(PLAB) Prácticas de laboratorio 711 Inglés primer cuatrimestre tarde
(PLAB) Prácticas de laboratorio 712 Inglés primer cuatrimestre tarde
(TE) Teoría 71 Inglés primer cuatrimestre tarde