Logo UAB

Tècniques d'Optimització per a la Visió per Computador

Codi: 44773 Crèdits: 6
2024/2025
Titulació Tipus Curs
4318299 Visió per Computador / Computer Vision OB 0

Professor/a de contacte

Nom:
Maria Isabel Vanrell Martorell
Correu electrònic:
maria.vanrell@uab.cat

Equip docent

Coloma Ballester Nicolau
Pablo Arias Martínez
Oriol Ramos Terrades

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Un grau en Enginyeria, Matemàtiques, Física o similar.


Objectius

Coordinadora del mòdul: Dra. Coloma Ballester

L'objectiu d'aquest mòdul és  l’aprenentatge dels algoritmes d'optimització i les tècniques d'inferència que estan darrere de moltes tasques en la visió per computador. Els conceptes principals inclouran la formulació adecuada d'energies i la seva resolució, tècniques numèriques per problemes variacionals, algoritmes d'optimització de descens de gradient i eines útils per a estratègies d'aprenentatge profund. optimització convexa i models gràfics. Aquestes tècniques s'apliquen en el projecte en el context de la segmentació d'imatges i inpainting.


Resultats d'aprenentatge

  1. CA06 (Competència) Aconseguir els objectius d'un projecte de visió fet en equip.
  2. KA02 (Coneixement) Identificar quins funcionals s'han d'optimitzar sobre les imatges per obtenir la solució a un problema de visió.
  3. KA09 (Coneixement) Seleccionar els millors algoritmes que es poden fer servir per optimitzar els funcionals que s'han de resoldre per solucionar un problema de visió.
  4. SA02 (Habilitat) Aplicar i avaluar tècniques d'optimització sobre imatges per solucionar un problema particular.
  5. SA09 (Habilitat) Seleccionar les millors eines de programari per codificar les tècniques d'optimització sobre imatges per solucionar un problema particular.
  6. SA15 (Habilitat) Preparar un informe que descrigui, justifiqui i il·lustri el desenvolupament d'un projecte de visió.
  7. SA17 (Habilitat) Preparar presentacions orals que permetin debatre els resultats del desenvolupament d'un projecte de visió.

Continguts

1. Introducció a problemes d’optimització i mètodes de minimització d’energia. Exemples i visió general d’una formulació variacional.

2. Repàs de l'àlgebra lineal computacional: mètodes de mínims quadrats, descomposició en valors singulars, pseudoinversa, mètodes iteratius. Aplicacions.

3. Tècniques numèriques per a problemes variacionals: derivada de Gateaux, equació d'Euler-Lagrange i mètodes de gradient. Aplicacions: denoising, inpainting d'imatges i Poisson editing. L’estratègia de Backpropagation per al càlcul de gradients. Algorismes d’optimització de descens per gradient útils per a estratègies  d’aprenentatge profund.

4. Optimització convexa. Optimització amb i sense restriccions. Principis i mètodes de la dualitat. Problemes no-convexos i relaxació convexa. Aplicacions: restauració per Variació Total, càlcul de disparitat, càlcul de flux òptic.

5. Segmentació amb models variacionals. El funcional de Mumford i Shah. Representacions de forma explícita i implícita. Formulació amb conjunts de nivell.

6. Xarxes Bayessianes i MRFs. Tipus d'Inferència. Principals algoritmes d'inferència. Exemples: stéreo, denoising.

7. Algorismes d'inferència. Belief propagation: message passing, loopy belief propagation. Exemple: inferència per a segmentació.

8. Mètodes de mostreig: Mètodes basats en partícules, Markov Chain Monte Carlo, Gibbs Sampling.


Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Sessions teòriques 20 0,8 CA06, KA02, KA09, SA02, SA09, SA15, SA17, CA06
Tipus: Supervisades      
Sessions de seguiment de projectes 8 0,32 CA06, KA02, KA09, SA02, SA09, SA15, SA17, CA06
Tipus: Autònomes      
Treball autònom 113 4,52 CA06, KA02, KA09, SA02, SA09, SA15, SA17, CA06

Sessions supevisades: (Algunes d'aquestes sessions podrien ser en línia sincròniques)

  • Sesions magistrals, on els professors explicaran continguts generals dels diferents temes. La majoria seran necesaris per a la resolució de problemes.

Sessions dirigides:  

  • Sesions de projecte, on es presentaran i discutiran els objetius i problemes dels projectes. Els estudiants hauran d'interactuar amb el coordinador de projecte sobre els problemes surgits i les idees per a resoldre'ls.  (Approx. 1 hora/setmana)
  • Sesions de presentació, on els estudiants faran una presentació oral sobre como han solucionat el projecte i sobre els resultats obtinguts.
  • Sesió d'exàmen, on els estudiants seran avaluats individualment, demostrant l'adquisició dels coneixements desenvolupats i la capacitat de resolució de problemes associats.

Treball autònom:

  • Els estudiants hauran d'estudiar i treballar autònomament amb els materials derivavts de les classes magistrals i de les sessions de projecte.
  • Els estudiants treballaran en grup per a resoldre els problemes plantejats en els projectes amb els següents entregables:
    • Codi
    • Informe
    • Presentació oral

 

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Assistència a sessions 0,05 0,5 0,02 CA06, KA02, KA09, SA02, SA09, SA15, SA17
Exàmen 0,4 2,5 0,1 CA06, KA02, KA09, SA02, SA09, SA15, SA17
Projecte 0,55 6 0,24 CA06, KA02, KA09, SA02, SA09, SA15, SA17

La nota final es calcularà mitjançant la següent fórmula :

Nota final = 0.4 x Examen + 0.55 x Projecte + 0.05 x Assistència

on

Examen: és la nota obtinguda de l'examen (ha de ser >=3). Pot ésser incrementada per punts extra corresponents als exercicis proposats en les classes d'alguns temes, però només si la nota de l'examen és com a mínim 3.0.

Assistència: nota derivada del control d'assistència a les classes (mínim 70%)

Projecte: nota atorgada pel coordinador del projecte basada en el seguiment que fa setmanalment i en els lliuraments del projecte (ha de ser >=5). Tot això d'acord amb criteris específics com ara:

  • Participació i discusió a les sessions i treball en grup (avaluacions intre pars)
  • Lliurament de parts obligatòries i opcionals
  • Codi desenvolupat (estil, comentaris, etc.)
  • Informe escrit (justificació de les decisions de desenvolupament)
  • Presentació oral i demostració

Només els estudiants que han suspès (nota final < 5.0) poden fer l'examen de recuperació.


Bibliografia

Journal articles:

  1. Xavier Bresson and Tony F. Chan. “Fast Dual Minimization of the Vectorial Total Variation Norm and Applications to Color Image Processing. Inverse Problems and Imaging”. American Institue of Mathematical Sciences. Vol 2, No. 4, pp 455-484 2008.
  2. Chan, T. F., & Vese, L. a. “Active contours without edges”. IEEE Transactions on Image Processing : A Publication of the IEEE Signal Processing Society, 10(2), pp 266–77, 2001.
  3. Daphne Koller and Nir Friedman, "Probablistic Graphical Models. Principles and techniques", 2009.
  4. Patrick Pérez, Michel Gangnet, and Andrew Blake. “Poisson image editing”. In ACM SIGGRAPH 2003 Papers (SIGGRAPH '03). ACM, New York, NY, USA, 313-318 2003.
  5. L.I. Rudin, S. Osher, and E. Fatemi. “Nonlinear Total Variation based Noise Removal Algorithms”. Physical D Nonlinear Phenomena, 60, pp 259-268, November 1992.
  6. Ruder, Sebastian. "An overview of gradient descent optimization algorithms." arXiv preprint arXiv:1609.04747(2016).

Books:

  1. S.P. Boyd, L. Vandenberghe, "Convex optimization",  Cambridge University Press, 2004.
  2. Tony F. Chan and Jianhong Shen. “Image Processing and Analysis: Variational, PDE, Wavelet and Stochastic Methods”. Society for Industrial and Applied Mathematics, 2005.
  3. J. Nocedal, S.J. Wright, “Numerical optimization”, Springer Verlag, 1999.
  4. Aubert Gilles, Pierre Kornprobst.  “Mathematical Problems in Image Processing:  Partial Differential Equations and the Calculus of Variations”.  Springer-Verlag New York.
  5. Joe D. Hoffman. “Numerical Methods for Engineers and Scientists
  6. Daphne Koller and Nir Friedman, "Probablistic Graphical Models. Principles and techniques", 2009.
  7. Sebastian Nowozin and Christoph H. Lampert, "Structured Learning and Prediction in Computer Vision", Foundations and Trends in Computer Graphics and Vision: Vol. 6: No. 3-4, pp 185-365, 2011.
  8. C. Pozrikidis. “Numerical Computation in Science and Engineering”.

Programari

Programació en Python amb especial atenció als paquets de processament d'imatges i optimització.


Llista d'idiomes

Nom Grup Idioma Semestre Torn
(PLABm) Pràctiques de laboratori (màster) 1 Anglès primer quadrimestre matí-mixt
(TEm) Teoria (màster) 1 Anglès primer quadrimestre matí-mixt