Logo UAB
2023/2024

Fonaments de la Visió per Computador

Codi: 106581 Crèdits: 6
Titulació Tipus Curs Semestre
2504392 Intel·ligència Artificial OB 2 1

Professor/a de contacte

Nom:
Jorge Bernal del Nozal
Correu electrònic:
jorge.bernal@uab.cat

Idiomes dels grups

Podeu accedir-hi des d'aquest enllaç. Per consultar l'idioma us caldrà introduir el CODI de l'assignatura. Tingueu en compte que la informació és provisional fins a 30 de novembre de 2023.


Prerequisits

No hi ha requisits previs, aquesta assignatura és autònoma encara que es recomana haver aprovat les assignatures de programació de primer curs.


Objectius

L´objectiu principal de l´assignatura és que l´alumne conegui els aspectes bàsics de la visió per computador i el processament d´imatge. Més concretament, els objectius es poden resumir a:
Coneixements:
• Conéixer i entendre el procés de captació d'imatges
• Entendre el fenomen de la percepció visual humana
• Comprendre les fases en què es divideix la solució a un problema d‟anàlisi d‟imatges
• Saber identificar els avantatges i els desavantatges dels algorismes de visió per computador que s'expliquen
• Resoldre problemes reals usant tècniques de visió per ordinador
• Conèixer les limitacions dels problemes reals per decidir quina tècnica de visió per ordinador és més apropiada
• Saber triar l'algorisme de processament d'imatges més adequat per fer una tasca donada

Habilitats:
• Saber reconèixer en quines situacions aplicar algorismes de visió per ordinador pot ser apropiat per resoldre un problema
• Saber analitzar el problema que cal resoldre i dissenyar la solució òptima aplicant les tècniques apreses
• Redactar documents tècnics relacionats amb l‟anàlisi i la solució d‟un problema donat
• Programar els algorismes bàsics per solucionar els problemes proposats
• Avaluar els resultats obtinguts a partir de la solució implementada i valorar possibles millores
• Saber raonar i defensar cadascuna de les decisions preses al‟hora d‟arribar a una solució

Competències i resultats daprenentatge:
• Que els estudiants sàpiguen aplicar els seus coneixements a la seva feinao vocació d'una forma professional i posseeixin les competències que solen demostrar-se permitjà de l'elaboració i la defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi.
• Introduir canvis en els mètodes i processos de l'àmbit de coneixement per donar respostes innovadores a les necessitats i demandes de la societat.
• Analitzar una situació i identificar-ne els punts de millora.
• Proposar nous mètodes o solucions alternatives fonamentades.
• Proposar maneres noves de mesurar l'èxit o el fracàs de la implementació de propostes o idees innovadores.

• Desenvolupar pensament crític per analitzar de manera fonamentada i argumentada alternatives i propostes tant pròpies com alienes.

• Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l'equip.
• Analitzar i resoldre problemes de forma efectiva, generant propostes innovadores i creatives per assolir els objectius.
• Conceptualitzar i modelar alternatives de solucions complexes a problemes d'aplicació de la intel·ligència artificial en diferents àmbits, i planificar i gestionar projectes per al disseny i el desenvolupament de prototips que demostrin la validesa del sistema proposat.
• Identificar les millors representacions per definir els descriptors d'imatges
• Usar tècniques de processament d'imatges per planificar, desenvolupar, avaluar i implementar una solució a un problema particular
• Planificar, desenvolupar, avaluar i implementar una solució a un problema particular de reconeixement visual
• Concebre, dissenyar, analitzar i implementar sistemes intel·ligents capaços d'utilitzar la visió com a mecanisme per interaccionar amb l'entorn.
• Identificar els conceptes bàsics i aplicar de manera adequada les tècniques de processament d'imatges
• Seleccionar les millors tècniques de processament d'imatges per a la preparació de les imatges


Competències

  • Concebre, dissenyar, analitzar i implementar sistemes intel·ligents capaços d’utilitzar la visió com a mecanisme per interaccionar amb l’entorn.
  • Conceptualitzar i modelar alternatives de solucions complexes per a problemes d’aplicació de la intel·ligència artificial en diferents àmbits, i planificar i gestionar projectes per al disseny i desenvolupament de prototips que demostrin la validesa del sistema proposat.
  • Desenvolupar pensament crític per analitzar de manera fonamentada i argumentada alternatives i propostes tant pròpies com alienes.
  • Introduir canvis en els mètodes i els processos de l’àmbit de coneixement per donar respostes innovadores a les necessitats i demandes de la societat. 
  • Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.

Resultats d'aprenentatge

  1. Analitzar una situació i identificar-ne els punts de millora.
  2. Desenvolupar pensament crític per analitzar de manera fonamentada i argumentada alternatives i propostes tant pròpies com alienes.
  3. Identificar els conceptes bàsics i aplicar de manera adequada les tècniques de processament d’imatges.
  4. Identificar els conceptes bàsics i aplicar de manera adequada les tècniques d’optimització aplicades a les imatges.
  5. Identificar les millors representacions per definir descriptors d’imatges.
  6. Planificar, desenvolupar, avaluar i implementar una solució per a un problema particular de reconeixement visual.
  7. Seleccionar les millors tècniques de processament d’imatges per a la preparació de les imatges.
  8. Seleccionar les millors tècniques d’optimització per a l’extracció de característiques rellevants en imatges.
  9. Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.
  10. Utilitzar tècniques de processament d’imatges per planificar, desenvolupar, avaluar i implementar una solució per a un problema particular.
  11. Utilitzar tècniques d’optimització per planificar, desenvolupar, avaluar i implementar una solució per a un problema particular.

Continguts

1. Introducció a la visió per ordinador

  1. Model de Marr
  2. Sistema Visual Humà

2. Formació d'imatge digital

  1. Conceptes de llum, escena, colors
  2. Òptiques i càmeres

3. Processament d'imatges

  1. Mostratge
  2. Quantificació

c. Tipus d'imatges
4. Filtrat

  1. Filtrat lineal (Sistemes Lineals, Transformada de Fourier)
  2. Filtrat no lineal (Morfologia matemàtica)

5. Extracció de característiques

  1. Edges
  2. Corners
  3. Blobs

6. Descriptors de característiques

  1. Color
  2. Textura
  3. Forma

7. Introducció a problemes bàsics de visió per ordinador

  1. Detecció
  2. Segmentació
  3. Classificació
  4. Problema complet usant Bag of Words

Metodologia

Les diferents activitats de lassignatura sorganitzen de la següent manera. Cada setmana els estudiants tindran 4 hores de classe on es compaginaran explicacions teòriques breus amb la realització de petits casos pràctics. No hi haurà classes específiques dedicades exclusivament a classe magistral oa classe de problemes, la intenció és que es treballin determinats conceptes acotats de principi a fi en cadascuna de les classes.
Un cop acabat un bloc principal de temes, es durà a terme un projecte de curta durada (una o dues setmanes) que servirà per consolidar els continguts i preparar les activitats d'avaluació individuals.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Clase de Teoría y Problemas 26 1,04 1, 2, 3, 4, 5, 7, 8, 10, 11
Tipus: Supervisades      
Realització de projecte práctic 8 0,32 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Resolución de problemas prácticos en clase 10 0,4 1, 3, 4, 5, 6, 7, 8, 10, 11
Tipus: Autònomes      
Estudio de la materia 53 2,12 1, 3, 4, 5, 6, 7, 8, 10, 11
Realització de les pràctiques en grup 21 0,84 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Realització de problemes a casa 20 0,8 1, 3, 4, 5, 6, 7, 8, 10, 11

Avaluació

Se seguirà un procediment d'avaluació continuada, on cada activitat realitzada al llarg del curs contribueix a la nota final. Aquesta assignatura no preveu el sistema d’avaluació única
La nota final es calcula de la manera següent:
• Nota final: 0.4*Nota_teoria + 0.4*Nota_projectes + 0.1*Nota_problemes + 0.1*Nota_seguiment
Quant a la nota de teoria, es calcula de la manera següent:
• Nota_teoria: 0.5*Nota_Parcial1 + 0.5*Nota_Parcial2
• Aprovar (nota més gran que 5) cadascun dels parcials suposa eliminar matèria
• Cal treure'n un 5 com a nota final de teoria per superar l'assignatura.
Pel que fa a la nota de projectes, es calcula de la següent manera:
• Nota_projectes: 0.6*Nota_Projecte_Continua + 0.4*Nota_Projecte_Final (Bag of Words)
• A la nota de cada projecte es tindrà en compte tant la qualitat dels resultats obtinguts com l'habilitat dels estudiants per presentar-los i defensar-los en públic
• Cal treure un 5 a cadascun dels projectes per superar l'assignatura.
Pel que fa a la nota de problemes, es calcula com una mitjana de les notes dels diferents problemes curts lliurats al llarg del curs. Finalment, la nota de seguiment es basarà en activitats petites que es faran durant les classes per comprovar el grau d'assimilació dels coneixements (Kahoot! o similars).

Totes les activitats amb mínims necessaris per superar lassignatura (teoria i projecte) comptaran amb una segona oportunitat per recuperar nota. Sense perjudici d'altres mesures disciplinàries que es considerin oportunes, i d'acord amb la normativa acadèmica vigent, les irregularitats comeses per un estudiant que puguin conduir a una variació de la qualificació es qualificaran amb un zero (0). Les activitats davaluació qualificades daquesta manera i per aquest procediment no seran recuperables. Si cal superarqualsevol d'aquestes activitats d'avaluació per aprovar l'assignatura, aquesta assignatura quedarà suspesa directament, sense oportunitat de recuperar-la al mateix curs. Aquestes irregularitats inclouen, entre d'altres:

- la còpia total o parcial duna pràctica, informe, o qualsevol altra activitat davaluació;
- deixar copiar;
- presentar un treball de grup no fet íntegrament pels membres del grup;
- presentar com a propis materials elaborats per un tercer, encara que siguin traduccions o adaptacions, i en general treballs amb elements no originals i exclusius de l'estudiant;
- tenir dispositius de comunicació (com telèfons mòbils, smart watches, etc.) accessibles durant les proves d'avaluació teoricopràctiques individuals (exàmens).
La nota numèrica de lexpedient serà el valor menor entre 3.0 i la mitjana ponderada de les notes en cas que lestudiant hagi comès irregularitats en un acte davaluació (i per tant no serà possible laprovat per compensació).
En resum: copiar, deixar copiar o plagiar a qualsevol de les activitats d'avaluació equival a un SUSPENS amb nota inferior a 3.5.


Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Avaluació de práctiques Veure activitats e instruments d'avaluació 4 0,16 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Examen final Veure activitats i instruments d'avaluació 3 0,12 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Primer parcial teoría Veure activitats i instruments d'avaluació 2,5 0,1 3, 4, 7, 10, 11
Segon parcial teoría Veure activitats i instruments d'avaluació 2,5 0,1 1, 4, 5, 6, 8, 11

Bibliografia

  • Simon J.D. Prince, Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2012.(http://www.computervisionmodels.com/)
  • David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach (2nd Edition), Prentice Hall 2011.
  • Rafael C. Gonzalez and Richard E. Woods, Digital Image Processing (3rd Edition), Prentice Hall 2007.
  • Richard Szeliski, Computer Vision: Algorithms and Applications, Springer (Texts in computer Science) 2011. (http://szeliski.org/Book/)
  • Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)
  • Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.

Cursos online:


Programari

S'usarà el següent programari a l'assignatura:
• Python
Tota la comunicació amb els estudiants es farà mitjançant el Campus Virtual de la UAB