Logo UAB
2020/2021

Visió per Computador

Codi: 102784 Crèdits: 6
Titulació Tipus Curs Semestre
2502441 Enginyeria Informàtica OB 3 2
2502441 Enginyeria Informàtica OT 4 2
La metodologia docent i l'avaluació proposades a la guia poden experimentar alguna modificació en funció de les restriccions a la presencialitat que imposin les autoritats sanitàries.

Professor/a de contacte

Nom:
Felipe Lumbreras Ruíz
Correu electrònic:
Felipe.Lumbreras@uab.cat

Utilització d'idiomes a l'assignatura

Llengua vehicular majoritària:
espanyol (spa)
Grup íntegre en anglès:
No
Grup íntegre en català:
No
Grup íntegre en espanyol:

Altres indicacions sobre les llengües

alguns materials docentes són en català, castellà i anglès

Prerequisits

No hi ha prerequisits. Aquesta assignatura és força autocontinguda. No obstant això en aquesta assignatura es tocaran temes relacionats amb càlcul matemàtic, probabilitat i teoria del senyal per tant es necessiten coneixements en aquestes àrees. Per altra banda, relacionat amb la programació, a les pràctiques es faran programes que necessitaran una bona base de programació. Per tot això és recomanable tenir les assignatures "Laboratori de programació", "Metodologia de la programació" i "Fonaments d'Informàtica" superades. I per afinitat en els continguts haver cursat "Intel·ligència Artificial".

Objectius

L’assignatura de Visió per Computador s’emmarca dins de la menció de “Computació” amb les assignatures de “Coneixement, Raonament i Incertesa”, “Aprenentatge Computacional” i “Robòtica, Llenguatge i Planificació” que formen part de la matèria anomenada Sistemes cognitius. Per tant, la seva temàtica està relacionada amb l’assignatura d’Intel·ligència Artificial de segon curs.

Els objectius de l’assignatura es poden resumir en:

Coneixements:

  • Conèixer, entendre i saber modelar l'adquisició d'imatges mitjançant una càmera.
  • Entendre el fenomen de la percepció visual humana.
  • Descriure i relacionar les fases en què es divideix la solució a un problema d’anàlisi d'imatges.
  • Identificar els avantatges i inconvenients dels algorismes de visió per computador que s’expliquen.
  • Resoldre problemes reals relacionats amb tècniques de visió per trobar una solució.
  • Entendre el resultat i les limitacions de les tècniques de visió en diferents casos d’estudi.
  • Saber escollir l’algorisme de processament d'imatges més adient per solucionar una tasca donada.
  • Saber escollir les tècniques de visió per computador més adequades per solucionar problemes contextualitzats.

 Habilitats:

  • Reconèixer les situacions en les quals l’aplicació d’algorismes de visió per computador pot ser adient per solucionar un problema.
  • Analitzar el problema a resoldre i dissenyar la solució òptima aplicant les tècniques apreses.
  • Redactar documents tècnics relacionats amb l’anàlisi i la solució d’unproblema.
  • Programar els algorismes bàsics per solucionar els problemes proposats.
  • Avaluar els resultats de la solució implementada i valorar les possibles millores.
  • Defensar i argumentar les decisions preses en la solució dels problemes proposats.

Competències

    Enginyeria Informàtica
  • Adquirir hàbits de treball personal.
  • Capacitat per a adquirir, obtenir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns inteligents.
  • Capacitat per a conèixer els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin les tècniques esmentades en qualsevol àmbit d'aplicació.
  • Capacitat per a tenir un coneixement profund dels principis fonamentals i models de la computació i saber-los aplicar per a interpretar, seleccionar, valorar, modelar i crear nous conceptes, teories, usos i desenvolupaments tecnològics relacionats amb la informàtica.
  • Comunicació.
  • Treballar en equip.

Resultats d'aprenentatge

  1. Aplicar els mètodes bàsics de processament d'imatges a problemes específics.
  2. Comunicar eficientment, oralment o per escrit, coneixements, resultats i habilitats, tant en entorns professionals com davant de públics no experts.
  3. Conèixer les diferents opcions tecnològiques per a l'elecció del sistema d'adquisició d'imatges òptim per a un propòsit específic.
  4. Extreure els descriptors de forma dels objectes presents a una escena.
  5. Gestionar el temps i els recursos disponibles. Treballar de manera organitzada.
  6. Implementar mètodes de representació del coneixement per a la identificació dels objectes presents a l'escena.
  7. Treballar cooperativament.
  8. Treballar de manera autònoma.

Continguts

1.Formació de la imatge

Llum, escena, sistema visual humà, color
Òptiques i càmeres

2. Processament d’imatges

Imatges, mostreig i quantització, tipus d'imatges

3. Filtrat lineal

Sistemes Lineals, Transformada de Fourier

4. Filtrat no lineal

Morfologia matemàtica binària i en nivell de grisos

5. Transformacions geomètriques

Mapeig, remostreig, aplicacions
Model de càmera, homografia

6. Característiques

Punts, contorns (agrupació), regions
Descriptors, aplicacions

7. Segmentació

Global, local
Clustering
Etiquetatge

8. Classificació

Reconeixement, aprenentatge, classificació
Reducció de la dimensió
Validació

9. Miscel·lània

Bag of Words 
Reconstrucció 3D
Fluxe òptic

10. Deep Learning en Visió per Computador

Metodologia

Les diferents activitats que es duran a terme en l’assignatura s’organitzen de la següent manera:

Classes magistrals

S’exposaran els principals conceptes i algorismes de cada tema de teoria. Aquests temes suposen el punt de partida en el treball de l’assignatura.

Seminaris de problemes

Seran classes amb grups reduïts d'estudiants que facilitin la interacció. En aquestes classes es plantejaran casos pràctics que requereixin el disseny d'una solució en què es facin servir els mètodes vistos a les classes de teoria.

Pràctiques de laboratori

Hi haurà un seguit de pràctiques comunes que permetran assolir unes competències bàsiques en temes de visió. Una primera entrega fora d'hores de laboratori per conèixer les eines. Tres pràctiques temàtiques relacionades estretament amb la teoria que s'està donant al mateix temps o prèvia. Finalment un projecte escollit pels mateixos alumnes. A la segona part del semestre hauran d’analitzar aquest problema, dissenyar i implementar solucions basades en diferents algorismes de processament i visió vistos a classe, analitzar els resultats obtinguts en cadascun dels mètodes, defensar la seva solució i fer la presentació en públic dels resultats.

Els grups de treball estaran formats per grups d'1 a 3 alumnes i s’hauran de formar la segona setmana del curs. Aquests grups de treball s’hauran de mantenir fins al final del curs i s’hauran d’autogestionar: repartiment de rols, planificació del treball, assignació de tasques, gestió dels recursos disponibles, conflictes, etc. Tot i que el professor guiarà el procés d’aprenentatge, la seva intervenció en la gestió dels grups serà mínima.

Per desenvolupar el projecte, els grups treballaran de forma autònoma i les sessions de pràctiques s’han de dedicar principalment a resoldre dubtes amb el professor que farà el seguiment de l’estat del projecte, indicarà errors a corregir, proposarà millores, etc.

Algunes de les sessions es marcaran com sessions de control on s’haurà de lliurar una pràctica. En aquestes sessions els grups hauran d’explicar la feina feta i el professor farà qüestions a tots els membres del grup per valorar la feina realitzada. L’assistència a aquestes sessions és obligatòria.

En el lliurament final els grups faran una presentació del projecte on explicaran el projecte desenvolupat, la solució adoptada i els resultats obtinguts. En aquesta presentació cada membre del grup haurà de fer una part de la presentació.

El codi de les pràctiques comunes es desenvoluparà en llenguatge Matlab i python. La part del projecte serà lliure a escollir pels alumnes.

Competències transversals:

  • T02.01 - Treballar de forma autònoma.
  • T02.03 - Gestionar el temps i els recursos disponibles. Treballar de forma organitzada.
  • T03.01 - Treballar cooperativament.
  • T04.01 - Comunicar eficientment, de manera oral i / o escrita, coneixements, resultats i habilitats, tant en entorns professionals com davant de públics no experts.

Les Competències Transversals lligades a T02 són avaluades a teoria i problemes en la major part. No hi ha una part específica de la nota pel treball autònom i la gestió del temps perquè està implícit en la forma de treballar-les. Tant la teoria, com els problemes, com el Lab0 són les parts de l'assignatura que l'alumne ha de ferde forma individual (T02.01) i els problemes i el Lab0 tenen associades fites i dates de lliurament que anirien en la línia marcada al (T02.03). Les vinculades amb T03 i T04 es treballen i són avaluades a la part de pràctiques. Una part de la nota del projecte final reflecteix com s'expressa l'alumne en públic a l'hora de transmetre els resultats del seu treball (T04.01), una altra part de la nota d'aquest projecte final avalua la redacció del material de suport del projecte (T04.01). Els Lab1, Lab2, Lab3 i Projecte es fan en grup i reforcen les competències de treball cooperatiu (T3.01).

Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classe magistral 20 0,8 1, 3, 8
Práctiques de laboratori 10 0,4 1, 2, 3, 4, 5, 6, 7, 8
Seminaris de problemes 11,5 0,46 1, 3
Tipus: Supervisades      
Anàlisi i disseny del projecte 12 0,48 1, 3, 4, 5, 6
Documentació del projecte 6 0,24 1, 3
Tipus: Autònomes      
Estudi individual 45 1,8 1, 3, 4, 6, 8
Presentació oral 12 0,48 1, 2, 3, 5, 7, 8
Programació projecte 25 1 1, 3, 4, 6

Avaluació

Activitats i instruments d’avaluació:

Avaluació continuada. L'alumne veu en tot moment la seva evolució a l'assignatura i com s'assoleixen els diferents objectius tant de pràctiques com de problemes i teoria.

- Coneixements teòrics

La nota final de teoria es calcularà a partir de la nota de dues proves:

               Nota Teoria = 0.5 Bloc1 + 0.5 Bloc2

Aquestes proves pretenen una avaluació individualitzada de l'estudiant amb les seves capacitats de resoldre problemes fent servir les tècniques explicades a classe així com avaluar el nivell de conceptualització que l'estudiant n'ha fet de les tècniques vistes.

Recuperació (teoria). Si l'alumne vol pujar nota o recuperar pot presentar-se a l'examen final dividit també en dos blocs.

- Problemes

Els problemes seran avaluats juntament amb les proves de teoria, ja que els problemes complementen la teoria. La recuperació d'aquesta part es farà juntament amb la teoria. Examen de recuperació.

Recuperació (problemes). Si l'alumne vol pujar nota o recuperar pot presentar-se a l'examen final dividit també en dos blocs.

              Nota de Problemes = 0.5 Bloc1 + 0.5 Bloc2

- Pràctiques

La part pràctica és un seguit de petits projectes. L’avaluació d’aquesta part inclourà:

  • Avaluació individual del Lab0 que introdueix les eines de treball que es faran servir en les pràctiques. També les parts d'exposició del projecte final són avaluades de forma individual.
  • Avaluació conjunta de les pràctiques: nota única per tots els membres del grup de treball que valorarà els resultats obtinguts i la qualitat del codi.
  • Avaluació del projecte que valorarà, els objectius assolits tant pel grup com individualment, els resultats obtinguts i la presentació.

La nota d’aquesta part es calcularà segons la fórmula:

            Nota Pràctiques = (1/20) Lab0  + (3/20) Lab1 + (3/20) Lab2 + (3/20) Lab3 + (10/20) Projecte

Recuperació (pràctiques). La recuperació d'aquesta part consistirà en el lliurament del material no entregat abans però amb un factor de penalització multiplicatiu de 0.8.

- Avaluació final

La Nota Final de l’assignatura s’obté combinant l’avaluació d’aquestes activitats de la manera següent:

            Nota Final = 0.3 Nota Teoria+ 0.3 Nota Problemes + 0.4 Nota Pràctiques

La nota final que apareixerà a l'expedient llevat de casos particulars de còpia i plagis o "No avaluable" serà el resultat d'aplicar la fórmula Nota final, també pels casos de suspens.

Les matrícules d'honor (MH) es donaran a les persones amb millor nota que superin el 9, ordenades per ordre d'arribada a aquesta nota i es donaran tantes com es puguin donar per la ràtio de matriculats.

Condicions:

Si l'alumne es presenta a un examen parcial o si es presenta a una sessió de control de pràctiques, ja no podrà ser avaluat com a "No avaluable" en el cas que no es presenti a les altres avaluacions, sinó que se li calcularà la nota final a partir d'aquelles avaluacions continuades a què s'hagi presentat.

Aclariments:

  • 5.00 és la nota per aprovar. 4.99 o inferior és suspès.
  • En el cas dels estudiants repetidors, les pràctiques de l'any anterior, si es manté la temàtica, es poden tornar a presentar. Això vol dir no una convalidació directa sinó que s'han de tornar a defensar en una única entrevista amb el professor de pràctiques. La resta d'activitats d'avaluació (teoria i problemes) s'han de tornar a avaluar de la manera establerta.
  • Les dates d'avaluació continuada i lliurament de treballs es publicaran a la pàgina web de l'assignatura o a Caronte i poden estar subjectes a canvis de programació per motius d'adaptació a possibles incidències; sempre s'informarà a la pàgina web de l'assignatura o a Caronte sobre aquests canvis, ja que s’entén que la pàgina web de l'assignatura o Caronte són els mecanismes habituals d'intercanvi d'informació entre professor i estudiants.
  • Per a cada activitat d’avaluació, s’indicarà un lloc, data i hora de revisió en la que l'estudiant podrà revisar l’activitat amb el professor. En aquest context, es podran fer reclamacions sobre la nota de l’activitat, que seran avaluades pel professorat responsable de l’assignatura. Si l'estudiant no es presenta a aquesta revisió, no es revisarà posteriorment aquesta activitat.

  • Sense perjudici d'altres mesures disciplinàries que s'estimin oportunes, i d'acord amb la normativa acadèmica vigent, lesirregularitats comeses per un estudiant que puguin conduir a una variació de la qualificació es qualificaran amb un zero (0). Les  activitats d'avaluació qualificades d'aquesta forma i per aquest procediment no seran recuperables. Si és necessari superar qualsevol d'aquestes activitats d'avaluació per aprovar l'assignatura, aquesta assignatura quedarà suspesa directament, sense oportunitat de  recuperar-la en el mateix curs. Aquestes irregularitats inclouen, entre d'altres:
    -  la còpia total o parcial d'una pràctica, informe, o qualsevol altra activitat d'avaluació;
    -  deixar copiar;
    -  presentar un treball de grup no fet íntegrament pels membres del grup;
    -  presentar com a propis materials elaborats per un tercer, encara que  siguin traduccions o adaptacions, i en general treballs amb elements no originals i exclusius de l'estudiant;
    -  tenir dispositius de comunicació (com telèfons mòbils, smart watches, etc.) accessibles durant les proves d'avaluació teòric-pràctiques individuals (exàmens).
    La nota numèrica de l'expedient serà el valor menor entre 3.0 i la mitjana ponderada de les notes en cas que l'estudiant hagi comès irregularitats en un acte d'avaluació (i per tant no serà possible l'aprovat per compensació).
    En resum: copiar, deixar copiar o plagiar en qualsevol de les activitats d'avaluació equival a un SUSPENS amb nota inferior a 3.5.

Activitats d'avaluació

Títol Pes Hores ECTS Resultats d'aprenentatge
Avaluació del grup 10% 0,25 0,01 1, 2, 7
Presentació del projecte 10% 0,25 0,01 1, 2, 3, 8
Proves teòriques individuals 60% 6 0,24 1, 2, 3, 4, 5, 6, 8
Pràctiques 20% 2 0,08 1, 2, 3, 4, 5, 6, 7

Bibliografia

  • Simon J.D. Prince, Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2012.(http://www.computervisionmodels.com/)
  • David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach (2nd Edition), Prentice Hall 2011.
  • Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing (3rd Edition), Prentice Hall 2007.
  • Richard Szeliski, Computer Vision: Algorithms and Applications, Springer (Texts in computer Science) 2011. (http://szeliski.org/Book/)
  • Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)
  • Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.
  • Joan Serrat, Llibre d'apunts de Processament d'imatges, 2006. (llibre)

Cursos similar i complementaris online