Logo UAB

Introducció a la Visió Humana i per Computador

Codi: 44772 Crèdits: 6
2024/2025
Titulació Tipus Curs
4318299 Visió per Computador / Computer Vision OB 0

Professor/a de contacte

Nom:
Maria Isabel Vanrell Martorell
Correu electrònic:
maria.vanrell@uab.cat

Equip docent

Javier Vazquez Corral
Javier Ruiz Hidalgo
Ramon Morros Rubio
Philippe Salembier Clairon

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Grau en Enginyeria, Matemàtiques, Física o similar.


Objectius

Coordinador del mòdul: Dr. Philippe Salembier

L'objectiu d'aquest mòdul és presentar als estudiants la visió per ordinador, inclosos els conceptes bàsics del sistema visual humà i la percepció, l'adquisició i el processament d'imatges. En termes de processament, el mòdul se centra en transformacions de baix nivell (basades en píxels), filtrat lineal, no lineal i morfològic, anàlisi de Fourier, representacions multiescala, extracció de característiques simples i descripcions d'imatges. A més, es presenten estratègies de classificació, segmentació i classificació elemental, així com metodologies d'avaluació de la qualitat dels algoritmes de processament d'imatges. Per posar en pràctica els algoritmes i tècniques, els estudiants treballaran en un projecte concret al llarg del curs. L'objectiu és proporcionar un coneixement aplicat d'una àmplia varietat de tècniques de visió per ordinador aplicades per resoldre problemes de visió del món real. L'objectiu del projecte és detectar objectes específics en imatges utilitzant tècniques bàsiques com segmentació, filtrat lineal i no lineal, agrupació, reconocimeinto de patrons, modelatge, etc. El coneixement obtingut es pot utilitzar per a una àmplia varietat d'aplicacions, per exemple, el control de qualitat, la detecció d'objectes genèrics, aplicacions de seguretat, etc.


Resultats d'aprenentatge

  1. CA06 (Competència) Aconseguir els objectius d'un projecte de visió fet en equip.
  2. KA01 (Coneixement) Identificar els mòduls de baix nivell, com ara preprocessament, extracció o agrupació de característiques, que són necessaris per solucionar un problema de visió.
  3. KA08 (Coneixement) Seleccionar els millors algoritmes que es poden fer servir per solucionar cadascun dels components d'un sistema de visió de baix nivell.
  4. SA01 (Habilitat) Aplicar i avaluar tècniques de processament de baix nivell per solucionar un problema particular.
  5. SA07 (Habilitat) Aplicar tècniques estadístiques d'anàlisi de dades i d'avaluació del rendiment a diferents problemes.
  6. SA08 (Habilitat) Seleccionar les millors eines de programari per codificar les tècniques de processament de baix nivell per solucionar un problema particular.
  7. SA15 (Habilitat) Preparar un informe que descrigui, justifiqui i il·lustri el desenvolupament d'un projecte de visió.
  8. SA17 (Habilitat) Preparar presentacions orals que permetin debatre els resultats del desenvolupament d'un projecte de visió.

Continguts

 

Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Clases de teoria 20 0,8 CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17, CA06
Tipus: Supervisades      
Sessions supervisades 8 0,32 CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17, CA06
Tipus: Autònomes      
Treball personal 113 4,52 CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17, CA06

Sessions supervisades: (algunas d'aquestes sessions podrien ser en-línia síncrones)
• Classes de teoria on els professors explicaran continguts generals sobre els temes. Alguns d'ells seran utilitzades per resoldre els problemes.

Sessions dirigides: 
• Sessions del projecte, on es presentaran i debatran els problemes i les metes dels projectes, els estudiants interactuaran amb el coordinador del projecte sobre problemes i idees per resoldre el projecte (aproximadament 1 hora / setmana).
• Sessió de presentació, on els estudiants fan una presentació oral sobre com han resolt el projecte i una demostració dels resultats.
• Sessió d'examen, on els estudiants són avaluats individualment. Assoliments de coneixement i habilitats per resoldre problemes.

Treball autònom:
• L'estudiant estudiarà i treballarà de manera autònoma amb els materials derivats de les classes.
• L'alumne treballarà en grups per resoldre els problemes dels projectes amb lliurables:
   • Codi
   • Informes
   • Presentacions orals

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Assistència 5% 0,5 0,02 CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17
Exàmen 40% 2,5 0,1 CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17
Projecte 55% 6 0,24 CA06, KA01, KA08, SA01, SA07, SA08, SA15, SA17

Les qualificacions finals per aquest mòdul es calcularan amb la següent fórmula:

Puntuació final = 0.4 x Examen + 0.55 x Projecte + 0.05 x Assistència

on,

Examen: és la nota obtinguda en l'examen del mòdul (ha de ser> = 3).

Assistència: és la qualificació derivada del control d'assistència a les conferències (mínim 70%)

Projecte: és la qualificació proporcionada pel coordinador del projecte en funció del seguiment setmanal del projecte i els resultats (ha de ser> = 5). Tot d'acord amb criteris específics com:

  • Participació en sessions de discussió i en treball en equip (avaluacions entre membres)
  • Lliurament d'exercicis obligatoris i opcionals.
  • Desenvolupament de codi (estil, comentaris, etc.)
  • Informe (justificació de les decisions en el desenvolupament del seu projecte)
  • Presentació (Xerrada i demostracions sobre el seu projecte)

Només els estudiants que han suspès (Nota final < 5.0) poden fer l'examen de recuperació.


Bibliografia

  1. Rafael C. Gonzalez, Richard E. Woods, “Digital Image Processing”, 3rd Edition.
  2. David Marr, “Vision: A Computational Investigation into the Human Representation and Processing of Visual Information”, Freeman, 1982.
  3. Richard Szeliski, “Computer Vision: Algorithms and Applications”, Springer-Verlag New York, Inc. New York, USA 2010.

Programari

Entorn de programació en Python amb especial atenció a les llibreries de visió per computador i processament d'imatges.


Llista d'idiomes

Nom Grup Idioma Semestre Torn
(PLABm) Pràctiques de laboratori (màster) 1 Anglès primer quadrimestre matí-mixt
(PLABm) Pràctiques de laboratori (màster) 2 Anglès primer quadrimestre matí-mixt
(TEm) Teoria (màster) 1 Anglès primer quadrimestre matí-mixt