Tècniques d'Optimització per a la Visió per Computador
Codi: 44773
Crèdits: 6
2024/2025
Titulació |
Tipus |
Curs |
4318299 Visió per Computador / Computer Vision |
OB |
0 |
Equip docent
- Coloma Ballester Nicolau
- Pablo Arias Martínez
- Oriol Ramos Terrades
Idiomes dels grups
Podeu consultar aquesta informació al final del document.
Prerequisits
Un grau en Enginyeria, Matemàtiques, Física o similar.
Objectius
Coordinadora del mòdul: Dra. Coloma Ballester
L'objectiu d'aquest mòdul és l’aprenentatge dels algoritmes d'optimització i les tècniques d'inferència que estan darrere de moltes tasques en la visió per computador. Els conceptes principals inclouran la formulació adecuada d'energies i la seva resolució, tècniques numèriques per problemes variacionals, algoritmes d'optimització de descens de gradient i eines útils per a estratègies d'aprenentatge profund. optimització convexa i models gràfics. Aquestes tècniques s'apliquen en el projecte en el context de la segmentació d'imatges i inpainting.
Resultats d'aprenentatge
- CA06 (Competència) Aconseguir els objectius d'un projecte de visió fet en equip.
- KA02 (Coneixement) Identificar quins funcionals s'han d'optimitzar sobre les imatges per obtenir la solució a un problema de visió.
- KA09 (Coneixement) Seleccionar els millors algoritmes que es poden fer servir per optimitzar els funcionals que s'han de resoldre per solucionar un problema de visió.
- SA02 (Habilitat) Aplicar i avaluar tècniques d'optimització sobre imatges per solucionar un problema particular.
- SA09 (Habilitat) Seleccionar les millors eines de programari per codificar les tècniques d'optimització sobre imatges per solucionar un problema particular.
- SA15 (Habilitat) Preparar un informe que descrigui, justifiqui i il·lustri el desenvolupament d'un projecte de visió.
- SA17 (Habilitat) Preparar presentacions orals que permetin debatre els resultats del desenvolupament d'un projecte de visió.
Continguts
1. Introducció a problemes d’optimització i mètodes de minimització d’energia. Exemples i visió general d’una formulació variacional.
2. Repàs de l'àlgebra lineal computacional: mètodes de mínims quadrats, descomposició en valors singulars, pseudoinversa, mètodes iteratius. Aplicacions.
3. Tècniques numèriques per a problemes variacionals: derivada de Gateaux, equació d'Euler-Lagrange i mètodes de gradient. Aplicacions: denoising, inpainting d'imatges i Poisson editing. L’estratègia de Backpropagation per al càlcul de gradients. Algorismes d’optimització de descens per gradient útils per a estratègies d’aprenentatge profund.
4. Optimització convexa. Optimització amb i sense restriccions. Principis i mètodes de la dualitat. Problemes no-convexos i relaxació convexa. Aplicacions: restauració per Variació Total, càlcul de disparitat, càlcul de flux òptic.
5. Segmentació amb models variacionals. El funcional de Mumford i Shah. Representacions de forma explícita i implícita. Formulació amb conjunts de nivell.
6. Xarxes Bayessianes i MRFs. Tipus d'Inferència. Principals algoritmes d'inferència. Exemples: stéreo, denoising.
7. Algorismes d'inferència. Belief propagation: message passing, loopy belief propagation. Exemple: inferència per a segmentació.
8. Mètodes de mostreig: Mètodes basats en partícules, Markov Chain Monte Carlo, Gibbs Sampling.
Activitats formatives i Metodologia
Títol |
Hores |
ECTS |
Resultats d'aprenentatge |
Tipus: Dirigides |
|
|
|
Sessions teòriques |
20
|
0,8 |
CA06, KA02, KA09, SA02, SA09, SA15, SA17, CA06
|
Tipus: Supervisades |
|
|
|
Sessions de seguiment de projectes |
8
|
0,32 |
CA06, KA02, KA09, SA02, SA09, SA15, SA17, CA06
|
Tipus: Autònomes |
|
|
|
Treball autònom |
113
|
4,52 |
CA06, KA02, KA09, SA02, SA09, SA15, SA17, CA06
|
Sessions supevisades: (Algunes d'aquestes sessions podrien ser en línia sincròniques)
- Sesions magistrals, on els professors explicaran continguts generals dels diferents temes. La majoria seran necesaris per a la resolució de problemes.
Sessions dirigides:
- Sesions de projecte, on es presentaran i discutiran els objetius i problemes dels projectes. Els estudiants hauran d'interactuar amb el coordinador de projecte sobre els problemes surgits i les idees per a resoldre'ls. (Approx. 1 hora/setmana)
- Sesions de presentació, on els estudiants faran una presentació oral sobre como han solucionat el projecte i sobre els resultats obtinguts.
- Sesió d'exàmen, on els estudiants seran avaluats individualment, demostrant l'adquisició dels coneixements desenvolupats i la capacitat de resolució de problemes associats.
Treball autònom:
- Els estudiants hauran d'estudiar i treballar autònomament amb els materials derivavts de les classes magistrals i de les sessions de projecte.
- Els estudiants treballaran en grup per a resoldre els problemes plantejats en els projectes amb els següents entregables:
- Codi
- Informe
- Presentació oral
Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.
Avaluació
Activitats d'avaluació continuada
Títol |
Pes |
Hores |
ECTS |
Resultats d'aprenentatge |
Assistència a sessions |
0,05 |
0,5
|
0,02 |
CA06, KA02, KA09, SA02, SA09, SA15, SA17
|
Exàmen |
0,4 |
2,5
|
0,1 |
CA06, KA02, KA09, SA02, SA09, SA15, SA17
|
Projecte |
0,55 |
6
|
0,24 |
CA06, KA02, KA09, SA02, SA09, SA15, SA17
|
La nota final es calcularà mitjançant la següent fórmula :
Nota final = 0.4 x Examen + 0.55 x Projecte + 0.05 x Assistència
on
Examen: és la nota obtinguda de l'examen (ha de ser >=3). Pot ésser incrementada per punts extra corresponents als exercicis proposats en les classes d'alguns temes, però només si la nota de l'examen és com a mínim 3.0.
Assistència: nota derivada del control d'assistència a les classes (mínim 70%)
Projecte: nota atorgada pel coordinador del projecte basada en el seguiment que fa setmanalment i en els lliuraments del projecte (ha de ser >=5). Tot això d'acord amb criteris específics com ara:
- Participació i discusió a les sessions i treball en grup (avaluacions intre pars)
- Lliurament de parts obligatòries i opcionals
- Codi desenvolupat (estil, comentaris, etc.)
- Informe escrit (justificació de les decisions de desenvolupament)
- Presentació oral i demostració
Només els estudiants que han suspès (nota final < 5.0) poden fer l'examen de recuperació.
Bibliografia
Journal articles:
- Xavier Bresson and Tony F. Chan. “Fast Dual Minimization of the Vectorial Total Variation Norm and Applications to Color Image Processing. Inverse Problems and Imaging”. American Institue of Mathematical Sciences. Vol 2, No. 4, pp 455-484 2008.
- Chan, T. F., & Vese, L. a. “Active contours without edges”. IEEE Transactions on Image Processing : A Publication of the IEEE Signal Processing Society, 10(2), pp 266–77, 2001.
- Daphne Koller and Nir Friedman, "Probablistic Graphical Models. Principles and techniques", 2009.
- Patrick Pérez, Michel Gangnet, and Andrew Blake. “Poisson image editing”. In ACM SIGGRAPH 2003 Papers (SIGGRAPH '03). ACM, New York, NY, USA, 313-318 2003.
- L.I. Rudin, S. Osher, and E. Fatemi. “Nonlinear Total Variation based Noise Removal Algorithms”. Physical D Nonlinear Phenomena, 60, pp 259-268, November 1992.
- Ruder, Sebastian. "An overview of gradient descent optimization algorithms." arXiv preprint arXiv:1609.04747(2016).
Books:
- S.P. Boyd, L. Vandenberghe, "Convex optimization", Cambridge University Press, 2004.
- Tony F. Chan and Jianhong Shen. “Image Processing and Analysis: Variational, PDE, Wavelet and Stochastic Methods”. Society for Industrial and Applied Mathematics, 2005.
- J. Nocedal, S.J. Wright, “Numerical optimization”, Springer Verlag, 1999.
- Aubert Gilles, Pierre Kornprobst. “Mathematical Problems in Image Processing: Partial Differential Equations and the Calculus of Variations”. Springer-Verlag New York.
- Joe D. Hoffman. “Numerical Methods for Engineers and Scientists“
- Daphne Koller and Nir Friedman, "Probablistic Graphical Models. Principles and techniques", 2009.
- Sebastian Nowozin and Christoph H. Lampert, "Structured Learning and Prediction in Computer Vision", Foundations and Trends in Computer Graphics and Vision: Vol. 6: No. 3-4, pp 185-365, 2011.
- C. Pozrikidis. “Numerical Computation in Science and Engineering”.
Programari
Programació en Python amb especial atenció als paquets de processament d'imatges i optimització.
Llista d'idiomes
Nom |
Grup |
Idioma |
Semestre |
Torn |
(PLABm) Pràctiques de laboratori (màster) |
1 |
Anglès |
primer quadrimestre |
matí-mixt |
(TEm) Teoria (màster) |
1 |
Anglès |
primer quadrimestre |
matí-mixt |