Logo UAB

Visió per Computador

Codi: 102784 Crèdits: 6
2024/2025
Titulació Tipus Curs
2502441 Enginyeria Informàtica OB 3
2502441 Enginyeria Informàtica OT 4

Professor/a de contacte

Nom:
Felipe Lumbreras Ruiz
Correu electrònic:
felipe.lumbreras@uab.cat

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

No hi ha prerequisits. Aquesta assignatura és força autocontinguda. No obstant això en aquesta assignatura es tocaran temes relacionats amb càlcul matemàtic, probabilitat i teoria del senyal per tant es necessiten coneixements en aquestes àrees. Per altra banda, relacionat amb la programació, a les pràctiques es faran programes que necessitaran una bona base de programació. Per tot això és recomanable tenir les assignatures "Laboratori de programació", "Metodologia de la programació" i "Fonaments d'Informàtica" superades. I per afinitat en els continguts haver cursat "Intel·ligència Artificial".


Objectius

L’assignatura de Visió per Computador s’emmarca dins de la menció de “Computació” amb les assignatures de “Coneixement, Raonament i Incertesa”, “Aprenentatge Computacional” i “Robòtica, Llenguatge i Planificació” que formen part de la matèria anomenada Sistemes cognitius. Per tant, la seva temàtica està relacionada amb l’assignatura d’Intel·ligència Artificial de segon curs.

Els objectius de l’assignatura es poden resumir en:

Coneixements:

  • Conèixer, entendre i saber modelar l'adquisició d'imatges mitjançant una càmera.
  • Entendre el fenomen de la percepció visual humana.
  • Descriure i relacionar les fases en què es divideix la solució a un problema d’anàlisi d'imatges.
  • Identificar els avantatges i inconvenients dels algorismes de visió per computador que s’expliquen.
  • Resoldre problemes reals relacionats amb tècniques de visió per trobar una solució.
  • Entendre el resultat i les limitacions de les tècniques de visió en diferents casos d’estudi.
  • Saber escollir l’algorisme de processament d'imatges més adient per solucionar una tasca donada.
  • Saber escollir les tècniques de visió per computador més adequades per solucionar problemes contextualitzats.

 Habilitats:

  • Reconèixer les situacions en les quals l’aplicació d’algorismes de visió per computador pot ser adient per solucionar un problema.
  • Analitzar el problema a resoldre i dissenyar la solució òptima aplicant les tècniques apreses.
  • Redactar documents tècnics relacionats amb l’anàlisi i la solució d’unproblema.
  • Programar els algorismes bàsics per solucionar els problemes proposats.
  • Avaluar els resultats de la solució implementada i valorar les possibles millores.
  • Defensar i argumentar les decisions preses en la solució dels problemes proposats.

Competències

    Enginyeria Informàtica
  • Adquirir hàbits de treball personal.
  • Capacitat per a adquirir, obtenir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns inteligents.
  • Capacitat per a conèixer els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin les tècniques esmentades en qualsevol àmbit d'aplicació.
  • Capacitat per a tenir un coneixement profund dels principis fonamentals i models de la computació i saber-los aplicar per a interpretar, seleccionar, valorar, modelar i crear nous conceptes, teories, usos i desenvolupaments tecnològics relacionats amb la informàtica.
  • Comunicació.
  • Treballar en equip.

Resultats d'aprenentatge

  1. Aplicar els mètodes bàsics de processament d'imatges a problemes específics.
  2. Comunicar eficientment, oralment o per escrit, coneixements, resultats i habilitats, tant en entorns professionals com davant de públics no experts.
  3. Conèixer les diferents opcions tecnològiques per a l'elecció del sistema d'adquisició d'imatges òptim per a un propòsit específic.
  4. Extreure els descriptors de forma dels objectes presents a una escena.
  5. Gestionar el temps i els recursos disponibles. Treballar de manera organitzada.
  6. Implementar mètodes de representació del coneixement per a la identificació dels objectes presents a l'escena.
  7. Treballar cooperativament.
  8. Treballar de manera autònoma.

Continguts

1.Formació de la imatge

Llum, escena, sistema visual humà, color
Òptiques i càmeres

2. Processament d’imatges

Imatges, mostreig i quantització, tipus d'imatges

3. Filtrat lineal

Sistemes Lineals, Transformada de Fourier

4. Filtrat no lineal

Morfologia matemàtica binària i en nivell de grisos

5. Transformacions geomètriques

Mapeig, remostreig, aplicacions
Model de càmera, homografia

6. Característiques

Punts, contorns (agrupació), regions
Descriptors, aplicacions

7. Segmentació

Global, local
Clustering
Etiquetatge

8. Classificació

Reconeixement, aprenentatge, classificació
Reducció de la dimensió
Validació

9. Miscel·lània

Bag of Words 
Reconstrucció 3D
Fluxe òptic

10. Deep Learning en Visió per Computador


Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classe magistral 20 0,8 1, 3, 8
Práctiques de laboratori 10 0,4 1, 2, 3, 4, 5, 6, 7, 8
Seminaris de problemes 11,5 0,46 1, 3
Tipus: Supervisades      
Anàlisi i disseny del projecte 12 0,48 1, 3, 4, 5, 6
Documentació del projecte 6 0,24 1, 3
Tipus: Autònomes      
Estudi individual 45 1,8 1, 3, 4, 6, 8
Presentació oral 12 0,48 1, 2, 3, 5, 7, 8
Programació projecte 25 1 1, 3, 4, 6

Les diferents activitats que es duran a terme en l’assignatura s’organitzen de la següent manera:

Classes magistrals

S’exposaran els principals conceptes i algorismes de cada tema de teoria. Aquests temes suposen el punt de partida en el treball de l’assignatura.

Seminaris de problemes

Seran classes amb grups reduïts d'estudiants que facilitin la interacció. En aquestes classes es plantejaran casos pràctics que requereixin el disseny d'una solució en què es facin servir els mètodes vistos a les classes de teoria.

Pràctiques de laboratori

Hi haurà un seguit de pràctiques comunes que permetran assolir unes competències bàsiques en temes de visió. Una primera entrega fora d'hores de laboratori per conèixer les eines. Tres pràctiques temàtiques relacionades estretament amb la teoria que s'està donant al mateix temps o prèvia. Finalment un projecte escollit pels mateixos alumnes. A la segona part del semestre hauran d’analitzar aquest problema, dissenyar i implementar solucions basades en diferents algorismes de processament i visió vistos a classe, analitzar els resultats obtinguts en cadascun dels mètodes, defensar la seva solució i fer la presentació en públic dels resultats.

Els grups de treball estaran formats per grups d'1 a 3 alumnes i s’hauran de formar la segona setmana del curs. Aquests grups de treball s’hauran de mantenir fins al final del curs i s’hauran d’autogestionar: repartiment de rols, planificació del treball, assignació de tasques, gestió dels recursos disponibles, conflictes, etc. Tot i que el professor guiarà el procés d’aprenentatge, la seva intervenció en la gestió dels grups serà mínima.

Per desenvolupar el projecte, els grups treballaran de forma autònoma i les sessions de pràctiques s’han de dedicar principalment a resoldre dubtes amb el professor que farà el seguiment de l’estat del projecte, indicarà errors a corregir, proposarà millores, etc.

Algunes de les sessions es marcaran com sessions de control on s’haurà de lliurar una pràctica. En aquestes sessions els grups hauran d’explicar la feina feta i el professor farà qüestions a tots els membres del grup per valorar la feina realitzada. L’assistència a aquestes sessions és obligatòria.

En el lliurament final els grups faran una presentació del projecte on explicaran el projecte desenvolupat, la solució adoptada i els resultats obtinguts. En aquesta presentació cada membre del grup haurà de fer una part de la presentació.

El codi de les pràctiques comunes es desenvoluparà en llenguatge Matlab i python. La part del projecte serà lliure a escollir pels alumnes.


Plataforma virtual:

Caronte serà la plataforma que farem servir per a la comunicació i el lliurament de tasques així com d'emmagatzematge de tot el material de l'assignatura.


Assistència:


Teoria: recomanable, Problemes: recomanable, Pràctiques: obligatòria, Seguiment de projecte: recomanable, Controls de projecte: obligatòria, Presentació de projecte: obligatòria.


Competències transversals:

  • T02.01 - Treballar de forma autònoma.
  • T02.03 - Gestionar el temps i els recursos disponibles. Treballar de forma organitzada.
  • T03.01 - Treballar cooperativament.
  • T04.01 - Comunicar eficientment, de manera oral i / o escrita, coneixements, resultats i habilitats, tant en entorns professionals com davant de públics no experts.

Les Competències Transversals lligades a T02 són avaluades a teoria i problemes en la major part. No hi ha una part específica de la nota pel treball autònom i la gestió del temps perquè està implícit en la forma de treballar-les. Tant la teoria, com els problemes, com el Lab0 són les parts de l'assignatura que l'alumne ha de ferde forma individual (T02.01) i els problemes i el Lab0 tenen associades fites i dates de lliurament que anirien en la línia marcada al (T02.03). Les vinculades amb T03 i T04 es treballen i són avaluades a la part de pràctiques. Una part de la nota del projecte final reflecteix com s'expressa l'alumne en públic a l'hora de transmetre els resultats del seu treball (T04.01), una altra part de la nota d'aquest projecte final avalua la redacció del material de suport del projecte (T04.01). Els Lab1, Lab2, Lab3 i Projecte es fan en grup i reforcen les competències de treball cooperatiu (T3.01).

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Avaluació del grup 10% 0,25 0,01 1, 2, 7
Presentació del projecte 10% 0,25 0,01 1, 2, 3, 8
Proves teòriques individuals 60% 6 0,24 1, 2, 3, 4, 5, 6, 8
Pràctiques 20% 2 0,08 1, 2, 3, 4, 5, 6, 7

Activitats i instruments d’avaluació:

AVALUACIÓ CONTINUADA.

L'alumne veu en tot moment la seva evolució a l'assignatura i com s'assoleixen els diferents objectius tant de pràctiques com de problemes i teoria.

Hi ha dos blocs diferenciats: Bloc 1 relacionat amb Processament del senyal i de les imatges (avaluat amb examen) i Bloc 2 relacionat amb Visió per Computador (avaluat amb ABP [Aprenentatge basat en Projecte])

Addicionalment hi ha elements opcionals per pujar nota: tests, reptes, lab3

BLOC 1

- Coneixements teòrics

La nota final de teoria es calcularà a partir de la nota d'un test de 25 preguntes: Nota Teoria Bloc1 

Aquesta prova pretén una avaluació individualitzada de l'estudiant amb les seves capacitats de resoldre problemes fent servir les tècniques explicades a classe així com avaluar el nivell de conceptualització que l'estudiant n'ha fet de les tècniques vistes.

Recuperació (teoria). Si l'alumne vol pujar nota o recuperar pot presentar-se a l'examen final.

Opcionals (teoria). Test setmanals d'entre 5 a 15 preguntes test

- Problemes

Els problemes seran 3 o 4 exercicis avaluats juntament amb la prova de teoria, ja que els problemes complementen la teoria: Nota de Problemes Bloc1

Recuperació (problemes). Si l'alumne vol pujar nota o recuperar pot presentar-se a l'examen final dividit també en dos blocs.

Opcionals (problemes). Reptes setmanals que consisteixen en un problema més llarg per entregar en forma de mini informe.        

- Pràctiques

La part pràctica és un seguit de projectes petits. L’avaluació d’aquesta part inclourà:

  • Avaluació individual del Lab0 que introdueix les eines de treball que es faran servir en les pràctiques. També les parts d'exposició del projecte final són avaluades de forma individual.
  • Avaluació conjunta de les pràctiques: nota única per tots els membres del grup de treball que valorarà els resultats obtinguts i la qualitat del codi.
  • Avaluació del projecte que valorarà, els objectius assolits tant pel grup com individualment, els resultats obtinguts i la presentació.

La nota d’aquesta part es calcularà segons la fórmula:

            Nota Pràctiques = 0.2 Lab0  + 0.4 Lab1 + 0.4 Lab2

Recuperació (pràctiques). La recuperació d'aquesta part consistirà en el lliurament del material no entregat abans però amb un factor de penalització multiplicatiu de 0.8.

Opcional (pràctiques). Lab3

 

BLOC 2

Projecte en grups de 3 persones que serà l'eix central de la segona meitat del curs. S'aplicarà ABP (aprenentatge basat en projectes). Una part de la nota vindrà donada per la resta d'integrants del grup i per la resta de la classe.

Recuperació. Si l'alumne vol recuperar pot presentar-se a un examen final especial per aquesta part.

- Nota Final (a. continuada)

 La Nota Final en avaluació continuada de l’assignatura s’obté combinant l’avaluació d’aquestes activitats de la manera següent:

             Nota Final =0.5 (0.25Nota Teoria Bloc 1 + 0.35 Nota Problemes  Bloc 1 + 0.4 Nota Pràctiques) + 0.5 Bloc 2

 

AVALUACIÓ ÚNICA.

En el cas que es vulgui optar per Avaluació única s'ha de lliurar i presentar de manera presencial abans dels exàmens finals, o el mateix dia de l'examen, el material relacionat amb les pràctiques. La nota de teoria i problemes sortirà dels exàmens. També hi haurà opció d'obtenir notes extres només dels reptes de problemes. 

Qui vulgui optar per aquest tipus d'avaluació ha de demanar-ho amb anticipació, com a mínim  una setmana abans de l'examen final (2n parcial).

- Nota Final (a. única)

La Nota Final en avaluació única de l’assignatura s’obté combinant l’avaluació d’aquestes activitats de la manera següent:

             Nota Final = 0.15 Nota Teoria Bloc 1 +  0.15 Nota Teoria Bloc 2 0.15 Nota Problemes  Bloc 1 0.15 Nota Problemes  Bloc 2 + 0.4 Nota Pràctiques 

Aquesta modalitat d'avaluació té opció de recuperació si s'ha presentat el material de pràctiques abans de l'examen de recuperació i s'ha fet l'examen final previ (2n parcial). 


Avaluació final

La nota final que apareixerà a l'expedient llevat de casos particulars de còpia i plagis o "No avaluable" serà el resultat d'aplicar la fórmula Nota final, també pels casos de suspens.

Les matrícules d'honor (MH) es donaran a les persones amb millor nota que superin el 9, ordenades per ordre d'arribada a aquesta nota i es donaran tantes com es puguin donar per la ràtio de matriculats.

Els alumnes que no participin en cap dels diferents elements avaluables (test, reptes, exàmens, pràctiques) rebran una nota de “No Avaluable”.

Condicions:

Si l'alumne es presenta a un examen parcial o si es presenta a una sessió de control de pràctiques, ja no podrà ser avaluat com a "No avaluable" en el cas que no es presenti a les altres avaluacions, sinó que se li calcularà la nota final a partir d'aquelles avaluacions continuades a què s'hagi presentat.

Aclariments:

  • 5.00 és la nota per aprovar. 4.99 o inferior és suspès.
  • En el cas dels estudiants repetidors, les pràctiques de l'any anterior, si es manté la temàtica, es poden tornar a presentar. Això vol dir no una convalidació directa sinó que s'han de tornar a defensar en una única entrevista amb el professor de pràctiques. La resta d'activitats d'avaluació (teoria i problemes) s'han de tornar a avaluar de la manera establerta.
  • Les dates d'avaluació continuada i lliurament de treballs es publicaran a la pàgina web de l'assignatura o a Caronte i poden estar subjectes a canvis de programació per motius d'adaptació a possibles incidències; sempre s'informarà a la pàgina web de l'assignatura o a Caronte sobre aquests canvis, ja que s’entén que la pàgina web de l'assignatura o Caronte són els mecanismeshabituals d'intercanvi d'informació entre professor i estudiants.
  • Per a cada activitat d’avaluació, s’indicarà un lloc, data i hora de revisió en la que l'estudiant podrà revisar l’activitat amb el professor. En aquest context, es podran fer reclamacions sobre la nota de l’activitat, que seran avaluades pelprofessoratresponsable de l’assignatura. Si l'estudiant no es presenta a aquesta revisió, no es revisarà posteriorment aquesta activitat.

  • Sense perjudici d'altres mesures disciplinàries que s'estimin oportunes, i d'acord amb la normativa acadèmica vigent, les irregularitats comeses per un estudiant que puguin conduir a una variació de la qualificació es qualificaran amb un zero (0). Les  activitats d'avaluació qualificades d'aquesta forma i per aquest procediment no seran recuperables. Si és necessari superar qualsevol d'aquestes activitats d'avaluació per aprovar l'assignatura, aquesta assignatura quedarà suspesa directament, sense oportunitat de  recuperar-la en el mateix curs. Aquestes irregularitats inclouen, entre d'altres:
    -  la còpia total o parcial d'una pràctica, informe, o qualsevol altra activitat d'avaluació;
    -  deixar copiar;
    -  presentar un treball de grup no fet íntegrament pels membres del grup;
    -  presentar com a propis materials elaborats per un tercer, encara que  siguin traduccions o adaptacions, i en general treballs amb elements no originals i exclusius de l'estudiant;
    -  tenir dispositius de comunicació (com telèfons mòbils, smart watches, etc.) accessibles durant les proves d'avaluació teòric-pràctiques individuals (exàmens).
    La nota numèrica de l'expedient serà el valor menor entre 3.0 i la mitjana ponderada de les notes en cas que l'estudiant hagi comès irregularitats en un acte d'avaluació (i per tant no serà possible l'aprovat per compensació).
    En resum: copiar, deixar copiar o plagiar en qualsevol de les activitats d'avaluació equival a un SUSPENS amb nota inferior a 3.5.

Bibliografia

  • Simon J.D. Prince, Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2012.(http://www.computervisionmodels.com/)
  • David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach (2nd Edition), Prentice Hall 2011.
  • Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing (3rd Edition), Prentice Hall 2007.
  • Richard Szeliski, Computer Vision: Algorithms and Applications, Springer (Texts in computer Science) 2011. (http://szeliski.org/Book/)
  • Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)
  • Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.
  • Joan Serrat, Llibre d'apunts de Processament d'imatges, 2006. (llibre)

Cursos similar i complementaris online


Programari

MatLab

Python


Llista d'idiomes

Nom Grup Idioma Semestre Torn
(PAUL) Pràctiques d'aula 441 Català/Espanyol segon quadrimestre matí-mixt
(PAUL) Pràctiques d'aula 442 Català/Espanyol segon quadrimestre matí-mixt
(PLAB) Pràctiques de laboratori 441 Espanyol segon quadrimestre matí-mixt
(PLAB) Pràctiques de laboratori 442 Espanyol segon quadrimestre matí-mixt
(PLAB) Pràctiques de laboratori 443 Espanyol segon quadrimestre matí-mixt
(PLAB) Pràctiques de laboratori 444 Espanyol segon quadrimestre tarda
(TE) Teoria 440 Espanyol segon quadrimestre matí-mixt