Logo UAB
2022/2023

Introducció a la Visió Humana i Computacional

Codi: 43085 Crèdits: 6
Titulació Tipus Curs Semestre
4314099 Visió per Computador / Computer Vision OB 0 1

Professor/a de contacte

Nom:
Maria Vanrell Martorell
Correu electrònic:
maria.vanrell@uab.cat

Utilització d'idiomes a l'assignatura

Llengua vehicular majoritària:
anglès (eng)

Equip docent

Javier Vazquez Corral
Javier Ruiz Hidalgo
Ramon Morros Rubio
Verónica Vilaplana Besler
Philippe Salembier Clairon

Prerequisits

Grau en Enginyeria, Matemàtiques, Física o similar.

Objectius

Coordinador del mòdul: Dr. Philippe Salembier

L'objectiu d'aquest mòdul és presentar als estudiants la visió per ordinador, inclosos els conceptes bàsics del sistema visual humà i la percepció, l'adquisició i el processament d'imatges. En termes de processament, el mòdul se centra en transformacions de baix nivell (basades en píxels), filtrat lineal, no lineal i morfològic, anàlisi de Fourier, representacions multiescala, extracció de característiques simples i descripcions d'imatges. A més, es presenten estratègies de classificació, segmentació i classificació elemental, així com metodologies d'avaluació de la qualitat dels algoritmes de processament d'imatges. Per posar en pràctica els algoritmes i tècniques, els estudiants treballaran en un projecte concret al llarg del curs. L'objectiu és proporcionar un coneixement aplicat d'una àmplia varietat de tècniques de visió per ordinador aplicades per resoldre problemes de visió del món real. L'objectiu del projecte és detectar objectes específics en imatges utilitzant tècniques bàsiques com segmentació, filtrat lineal i no lineal, agrupació, reconocimeinto de patrons, modelatge, etc. El coneixement obtingut es pot utilitzar per a una àmplia varietat d'aplicacions, per exemple, el control de qualitat, la detecció d'objectes genèrics, aplicacions de seguretat, etc.

Competències

  • Assumir tasques de responsabilitat en la gestió de la informació i el coneixement.
  • Comprendre, analitzar i sintetitzar els coneixements avançats que hi ha en l'àrea, així com proposar idees innovadores.
  • Conceptualitzar alternatives de solucions complexes per a problemes de visió i crear prototips que demostrin la validesa del sistema proposat.
  • Identificar els conceptes i aplicar les tècniques fonamentals més adequades per resoldre els problemes bàsics de la visió per computador.
  • Planificar, desenvolupar, avaluar i gestionar solucions per a projectes en els diferents àmbits de la visió per computador.
  • Que els estudiants sàpiguin aplicar els coneixements adquirits i la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
  • Que els estudiants tinguin les habilitats d'aprenentatge que els permetin continuar estudiant, en gran manera, amb treball autònom a autodirigit.
  • Seleccionar les eines de programari i els conjunts d'entrenament més adequats per desenvolupar les solucions per als problemes de visió per computador.
  • Tenir coneixements que aportin la base o l'oportunitat de ser originals en el desenvolupament o l'aplicació d'idees, sovint en un context de recerca.
  • Treballar en equips multidisciplinaris.

Resultats d'aprenentatge

  1. Assumir tasques de responsabilitat en la gestió de la informació i el coneixement.
  2. Comprendre, analitzar i sintetitzar els coneixements avançats que hi ha en l'àrea, així com proposar idees innovadores.
  3. Identificar i aplicar adequadament les tècniques de baix nivell dels sistemes de visió, concretament l'extracció i l'agrupament de característiques.
  4. Identificar les millors representacions que es puguin definir per extreure i agrupar característiques en projectes concrets.
  5. Que els estudiants sàpiguin aplicar els coneixements adquirits i la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
  6. Que els estudiants tinguin les habilitats d'aprenentatge que els permetin continuar estudiant, en gran manera, amb treball autònom a autodirigit.
  7. Relacionar les tècniques bàsiques de la visió per computador i el processament que es duu a terme en el sistema visual humà.
  8. Seleccionar tècniques de baix nivell de detecció i agrupament de característiques i entrenar-les per solucionar un projecte concret.
  9. Tenir coneixements que aportin la base o l'oportunitat de ser originals en el desenvolupament o l'aplicació d'idees, sovint en un context de recerca.
  10. Treballar en equips multidisciplinaris.
  11. Utilitzar tècniques de processament visual de baix nivell per planificar, desenvolupar, avaluar i gestionar una solució per a un problema concret

Continguts

 

Metodologia

Sessions supervisades: (algunas d'aquestes sessions podrien ser en-línia síncrones)
• Classes de teoria on els professors explicaran continguts generals sobre els temes. Alguns d'ells seran utilitzades per resoldre els problemes.

Sessions dirigides: 
• Sessions del projecte, on es presentaran i debatran els problemes i les metes dels projectes, els estudiants interactuaran amb el coordinador del projecte sobre problemes i idees per resoldre el projecte (aproximadament 1 hora / setmana).
• Sessió de presentació, on els estudiants fan una presentació oral sobre com han resolt el projecte i una demostració dels resultats.
• Sessió d'examen, on els estudiants són avaluats individualment. Assoliments de coneixement i habilitats per resoldre problemes.

Treball autònom:
• L'estudiant estudiarà i treballarà de manera autònoma amb els materials derivats de les classes.
• L'alumne treballarà en grups per resoldre els problemes dels projectes amb lliurables:
   • Codi
   • Informes
   • Presentacions orals

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.

Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Clases de teoria 20 0,8 3, 4, 5, 7, 8, 9, 11
Tipus: Supervisades      
Sessions supervisades 8 0,32 1, 2, 3, 4, 5, 6, 8, 9, 10, 11
Tipus: Autònomes      
Treball personal 113 4,52 1, 2, 3, 4, 5, 6, 8, 9, 10, 11

Avaluació

Les qualificacions finals per aquest mòdul es calcularan amb la següent fórmula:

Puntuació final = 0.4 x Examen + 0.55 x Projecte + 0.05 x Assistència

on,

Examen: és la nota obtinguda en l'examen del mòdul (ha de ser> = 3).

Assistència: és la qualificació derivada del control d'assistència a les conferències (mínim 70%)

Projecte: és la qualificació proporcionada pel coordinador del projecte en funció del seguiment setmanal del projecte i els resultats (ha de ser> = 5). Tot d'acord amb criteris específics com:

  • Participació en sessions de discussió i en treball en equip (avaluacions entre membres)
  • Lliurament d'exercicis obligatoris i opcionals.
  • Desenvolupament de codi (estil, comentaris, etc.)
  • Informe (justificació de les decisions en el desenvolupament del seu projecte)
  • Presentació (Xerrada i demostracions sobre el seu projecte)

Només els estudiants que han suspès (Nota final < 5.0) poden fer l'examen de recuperació.

Activitats d'avaluació

Títol Pes Hores ECTS Resultats d'aprenentatge
Assistència 5% 0,5 0,02 1
Exàmen 40% 2,5 0,1 2, 4, 6, 7, 9
Projecte 55% 6 0,24 1, 2, 3, 4, 5, 6, 8, 9, 10, 11

Bibliografia

  1. Rafael C. Gonzalez, Richard E. Woods, “Digital Image Processing”, 3rd Edition.
  2. David Marr, “Vision: A Computational Investigation into the Human Representation and Processing of Visual Information”, Freeman, 1982.
  3. Richard Szeliski, “Computer Vision: Algorithms and Applications”, Springer-Verlag New York, Inc. New York, USA 2010.

Programari

Entorn de programació en Python amb especial atenció a les llibreries de visió per computador i processament d'imatges.