Logo UAB
2023/2024

Introducció a la Visió Humana i per Computador

Codi: 44772 Crèdits: 6
Titulació Tipus Curs Semestre
4318299 Visió per Computador OB 0 1

Professor/a de contacte

Nom:
Maria Isabel Vanrell Martorell
Correu electrònic:
maria.vanrell@uab.cat

Idiomes dels grups

Podeu accedir-hi des d'aquest enllaç. Per consultar l'idioma us caldrà introduir el CODI de l'assignatura. Tingueu en compte que la informació és provisional fins a 30 de novembre de 2023.

Equip docent

Javier Vazquez Corral
Javier Ruiz Hidalgo
Ramon Morros Rubio
Verónica Vilaplana Besler
Philippe Salembier Clairon

Prerequisits

Grau en Enginyeria, Matemàtiques, Física o similar.


Objectius

Coordinador del mòdul: Dr. Philippe Salembier

L'objectiu d'aquest mòdul és presentar als estudiants la visió per ordinador, inclosos els conceptes bàsics del sistema visual humà i la percepció, l'adquisició i el processament d'imatges. En termes de processament, el mòdul se centra en transformacions de baix nivell (basades en píxels), filtrat lineal, no lineal i morfològic, anàlisi de Fourier, representacions multiescala, extracció de característiques simples i descripcions d'imatges. A més, es presenten estratègies de classificació, segmentació i classificació elemental, així com metodologies d'avaluació de la qualitat dels algoritmes de processament d'imatges. Per posar en pràctica els algoritmes i tècniques, els estudiants treballaran en un projecte concret al llarg del curs. L'objectiu és proporcionar un coneixement aplicat d'una àmplia varietat de tècniques de visió per ordinador aplicades per resoldre problemes de visió del món real. L'objectiu del projecte és detectar objectes específics en imatges utilitzant tècniques bàsiques com segmentació, filtrat lineal i no lineal, agrupació, reconocimeinto de patrons, modelatge, etc. El coneixement obtingut es pot utilitzar per a una àmplia varietat d'aplicacions, per exemple, el control de qualitat, la detecció d'objectes genèrics, aplicacions de seguretat, etc.


Resultats d'aprenentatge

  • CA06 (Competència) Aconseguir els objectius d'un projecte de visió fet en equip.
  • KA01 (Coneixement) Identificar els mòduls de baix nivell, com ara preprocessament, extracció o agrupació de característiques, que són necessaris per solucionar un problema de visió.
  • KA08 (Coneixement) Seleccionar els millors algoritmes que es poden fer servir per solucionar cadascun dels components d'un sistema de visió de baix nivell.
  • SA01 (Habilitat) Aplicar i avaluar tècniques de processament de baix nivell per solucionar un problema particular.
  • SA07 (Habilitat) Aplicar tècniques estadístiques d'anàlisi de dades i d'avaluació del rendiment a diferents problemes.
  • SA08 (Habilitat) Seleccionar les millors eines de programari per codificar les tècniques de processament de baix nivell per solucionar un problema particular.
  • SA15 (Habilitat) Preparar un informe que descrigui, justifiqui i il·lustri el desenvolupament d'un projecte de visió.
  • SA17 (Habilitat) Preparar presentacions orals que permetin debatre els resultats del desenvolupament d'un projecte de visió.

Continguts

 

Metodologia

Sessions supervisades: (algunas d'aquestes sessions podrien ser en-línia síncrones)
• Classes de teoria on els professors explicaran continguts generals sobre els temes. Alguns d'ells seran utilitzades per resoldre els problemes.

Sessions dirigides: 
• Sessions del projecte, on es presentaran i debatran els problemes i les metes dels projectes, els estudiants interactuaran amb el coordinador del projecte sobre problemes i idees per resoldre el projecte (aproximadament 1 hora / setmana).
• Sessió de presentació, on els estudiants fan una presentació oral sobre com han resolt el projecte i una demostració dels resultats.
• Sessió d'examen, on els estudiants són avaluats individualment. Assoliments de coneixement i habilitats per resoldre problemes.

Treball autònom:
• L'estudiant estudiarà i treballarà de manera autònoma amb els materials derivats de les classes.
• L'alumne treballarà en grups per resoldre els problemes dels projectes amb lliurables:
   • Codi
   • Informes
   • Presentacions orals

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Clases de teoria 20 0,8 KA01, KA08
Tipus: Supervisades      
Sessions supervisades 8 0,32 SA01, SA07, SA08
Tipus: Autònomes      
Treball personal 113 4,52 CA06, SA01, SA07, SA15, SA17

Avaluació

Les qualificacions finals per aquest mòdul es calcularan amb la següent fórmula:

Puntuació final = 0.4 x Examen + 0.55 x Projecte + 0.05 x Assistència

on,

Examen: és la nota obtinguda en l'examen del mòdul (ha de ser> = 3).

Assistència: és la qualificació derivada del control d'assistència a les conferències (mínim 70%)

Projecte: és la qualificació proporcionada pel coordinador del projecte en funció del seguiment setmanal del projecte i els resultats (ha de ser> = 5). Tot d'acord amb criteris específics com:

  • Participació en sessions de discussió i en treball en equip (avaluacions entre membres)
  • Lliurament d'exercicis obligatoris i opcionals.
  • Desenvolupament de codi (estil, comentaris, etc.)
  • Informe (justificació de les decisions en el desenvolupament del seu projecte)
  • Presentació (Xerrada i demostracions sobre el seu projecte)

Només els estudiants que han suspès (Nota final < 5.0) poden fer l'examen de recuperació.


Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Assistència 5% 0,5 0,02 CA06
Exàmen 40% 2,5 0,1 KA01, KA08, SA01, SA07, SA08
Projecte 55% 6 0,24 CA06, SA01, SA07, SA08, SA15, SA17

Bibliografia

  1. Rafael C. Gonzalez, Richard E. Woods, “Digital Image Processing”, 3rd Edition.
  2. David Marr, “Vision: A Computational Investigation into the Human Representation and Processing of Visual Information”, Freeman, 1982.
  3. Richard Szeliski, “Computer Vision: Algorithms and Applications”, Springer-Verlag New York, Inc. New York, USA 2010.

Programari

Entorn de programació en Python amb especial atenció a les llibreries de visió per computador i processament d'imatges.