Logo UAB
2023/2024

Visió i Aprenentatge

Codi: 106582 Crèdits: 6
Titulació Tipus Curs Semestre
2504392 Intel·ligència Artificial OT 3 1
2504392 Intel·ligència Artificial OT 4 1

Professor/a de contacte

Nom:
Jordi Gonzalez Sabate
Correu electrònic:
jordi.gonzalez@uab.cat

Idiomes dels grups

Podeu accedir-hi des d'aquest enllaç. Per consultar l'idioma us caldrà introduir el CODI de l'assignatura. Tingueu en compte que la informació és provisional fins a 30 de novembre de 2023.


Prerequisits

Haver cursat les assignatures de Fonaments d'Aprenentatge Automàtic, Fonaments de Programació, Fonaments de Visió per Computador, Probabilitat i Estadística, i Xarxes Neuronals i Aprenentatge Profund.

Es recomana que l'alumne tingui coneixements i capacitats de:

  • Programació en el llenguatge de programació Python
  • Processament de Senyal, Imatge i Vídeo
  • Validació estadística
  • Aprenentatge Computacional i Deep Learning

Objectius

Aproximadament cada dècada hi ha un tsunami tecnològic que transforma múltiples indústries. La Intel·ligència Artificial (IA) és aquesta onada que arrasa al món tecnològic actual. Si alguna vegada t'has preguntat:

  • com els ordinadors realitzen la detecció de cares en multituds?
  • com les aplicacions de videotrucades desenfoquen el fons o reemplacen el fons amb altres imatges?
  • com es desplacen els cotxes autònoms de forma segura en un entorn urbà?
  • com es segueix la pilota amb tanta precisió en esdeveniments esportius televisats com tennis, futbol i bàsquet?
  • podem saber el tractament de càncer més efectiu a partir de dades multimodals del pacient?
  • podem saber les emocions d'una persona amb un video?
  • com aprenen les màquines?

Si hem despertat la seva curiositat, aquest curs és el que necessites. En aquest curs apendrem sobre temes en Visió per Ordinador com Seguiment d'Objectes, Classificació d'Imatges, Medicina Personalitzada, Detecció de Cares, Flux Òptic, estimació d'Pose Humana i molts més.

A diferència d'altres cursos de visió per ordinador, aquest curs s'acosta a la visió per ordinador de manera més pràctica, experiencial i intuïtiva. El seu principal component és un conjunt de projectes que ha de ser desenvolupats pels estudiants repartits en equips. Tot el que es necessita és un coneixement pràctic del llenguatge de programació Python. 

Utilitzarem python que permet incorporar diferents biblioteques de visió per ordinador. L’utilitzen milers d’empreses, productes i dispositius i es prova cada dia per obtenir escalabilitat i rendiment. A més apendrem a dissenyar i adaptar xarxes específiques i a escollir quin és el mètode de processat més adient segons els requeriments i restriccions de cada aplicació. 

En resum, Visió i Aprenentatge és una assignaturade caràcter eminentment pràctic i interdisciplinar que se situa en el pont que hi ha entre la intel·ligència artificial i el món real i que pretén recórrer aquest pont en ambdues direccions.


Competències

    Intel·ligència Artificial
  • Analitzar i resoldre problemes de manera efectiva, i generar propostes innovadores i creatives per aconseguir els objectius.
  • Conceptualitzar i modelar alternatives de solucions complexes per a problemes d’aplicació de la intel·ligència artificial en diferents àmbits, i planificar i gestionar projectes per al disseny i desenvolupament de prototips que demostrin la validesa del sistema proposat.
  • Desenvolupar pensament crític per analitzar de manera fonamentada i argumentada alternatives i propostes tant pròpies com alienes.
  • Elaborar estratègies per formular i solucionar diferents problemes d’aprenentatge de manera científica, creativa, crítica i sistemàtica, coneixent les capacitats i limitacions dels diferents mètodes i eines existents.
  • Introduir canvis en els mètodes i els processos de l’àmbit de coneixement per donar respostes innovadores a les necessitats i demandes de la societat. 
  • Que els estudiants sàpiguen aplicar els coneixements propis a la seva feina o vocació d'una manera professional i tinguin les competències que se solen demostrar per mitjà de l'elaboració i la defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi.
  • Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.

Resultats d'aprenentatge

  1. Analitzar i resoldre problemes de manera efectiva, i generar propostes innovadores i creatives per aconseguir els objectius.
  2. Analitzar una situació i identificar-ne els punts de millora.
  3. Desenvolupar pensament crític per analitzar de manera fonamentada i argumentada alternatives i propostes tant pròpies com alienes.
  4. Dissenyar les millors arquitectures de xarxes convolucionals per a la resolució de problemes de reconeixement visual d’objectes i escenes.
  5. Identificar els conceptes bàsics i aplicar de manera adequada les tècniques d’aprenentatge computacional al reconeixement en imatges.
  6. Planificar, desenvolupar, avaluar i implementar una solució per a un problema particular de reconeixement visual.
  7. Proposar nous mètodes o solucions alternatives fonamentades.
  8. Que els estudiants sàpiguen aplicar els coneixements propis a la seva feina o vocació d'una manera professional i tinguin les competències que se solen demostrar per mitjà de l'elaboració i la defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi.
  9. Seleccionar i dissenyar els millors conjunts de dades per a l’entrenament de xarxes.
  10. Seleccionar i dissenyar els millors mètodes per a l’entrenament de xarxes neuronals.
  11. Seleccionar i dissenyar les millors tècniques per avaluar els resultats de l’entrenament de mètodes o xarxes.
  12. Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.
  13. Utilitzar tècniques d’aprenentatge computacional per planificar, desenvolupar, avaluar i implementar una solució per a un problema particular.

Continguts

1. Introducció a l'Aprenentatge Computacional en Visió per Computador

2. Classificació d'Imatges

3. Detecció d'Objectes

4. Segmentació de Regions

5. Indexació i Recuperació

6. Generació d'Imatges

7. Aprenentatge Multimodal

 


Metodologia

La gestió de la docència de l'assignatura es farà a través del gestor documental Caronte (http://caronte.uab.cat/), que servirà com a eina de gestió els equips de treball,  fer els lliuraments corresponents, veure les notes, comunicar-vos amb els professors, etc. Per poder-lo utilitzar cal fer els següents passos:

  1.  Donar-se d'alta com usuari donant el nom, NIU, i una foto carnet en format JPG. Si ja us heu donat d'alta per alguna altra assignatura, no cal tornar-ho a fer, podeu anar al següent pas.
  2.  Inscriure’s al tipus de docència "VISIÓ I APRENENTATGE", donant com a codi d'assignatura el proporcionat el primer dia de classe.

 

El curs seguirà una metodologia docent d'aprenentatge anomenada Aprenentatge Basat en Projectes (ABP). La metodologia ABP pretén potenciar i motivar a l'estudiant en el seu aprenentatge. Es formaran grups d'entre 5 i 6 estudiants als que se'ls encomanarà la realització d'un conjunt de projectes (de mida mitjana) al llarg del semestre. Es farà un seguiment setmanal i tutorització tant grupal com individual dels estudiants

Els projectes són fixats pel professorat de manera que compleixi les següents condicions:  ser el més real possible;  ser tractable mitjançant eines elementals; no tenir associat un algorisme de solució standard.

D'altra banda, és essencial entendre que no es tracta pas de trobar un algorisme que funcioni en el 100 x 100 dels casos —tot sovint no existeix tal cosa— sinó simplement de “donar-hi una proposta de solució raonable”.

Els projectes els han de desenvolupar cada equip amb la màxima autonomia possible. Cada equip tindrà assignat un tutor que en seguirà l'evolució però enprincipi s'abstindrà d'imposar les seves idees. D'altra banda, l'estudiant ha de tenir clar que no es tracta de buscar la ‘solució’ del problema en altres llocs, sino de fer una aportació original. Això no vol dir que s'hagi de renunciar a la informació que pugui existir en la bibliografia o a Internet; però quan se'n faci ús cal tenir informat el professor i explicar-ho en la memòria.

La realització del projecte ha de acabar en un programa i una memòria final. A més d'entregar-la en forma escrita, els resultats d'aquesta memòria seran objecte d'una exposició oral. Una i altra, memòria escrita i exposició oral, han d'anar dirigides principalment a l'entitat, segurament hipotètica, que hauria proposat el problema. Per regla general, els tecnicismes seran relegats a apartats concrets de la memòria escrita.

En les presentacions orals dels projectes s'espera que hi assisteixin tota la classes, i que aquests intervinguin mitjançant preguntes i observacions.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classes de teoria 10 0,4 5, 6, 9, 10, 11, 13
Tipus: Supervisades      
Taller de treball 20 0,8 1, 2, 4, 8, 9, 10, 11, 13
Tipus: Autònomes      
Treball personal 115 4,6 1, 2, 3, 4, 6, 7, 8, 12, 13

Avaluació

Donat que la major part de la feina gira al voltant d'un conjunt de projectes que es desenvolupa al llarg de tot el curs, l'avaluació té un caràcter continuat, i el seu resultat final no és recuperable.

 

Metodologia de Avaluació

S'avaluaran les actes que el grup escriurà després de cada sessió tutoritzada, en la que descriuran les seves discussions i acords i les enquestes d'autoavaluació que cada alumne farà dels seus companys i d'ell mateix. Al final de cada projecte els estudiants es farà una presentació oral del projecte i entregaran una memòria del treball realitzat. Ambdós seran avaluats per part dels professors de l'assignatura siguin o no els tutors. Els estudiants no realitzaran cap examen escrit. 

Per a l'avaluació  s'utilitzaran els següents INSTRUMENTS i ACTIVITATS:

  • Una avaluació feta pels professors a partir de la presentació dels projectes realitzat pel grup (qualitat del treball, presentació, memòria entregada). Nota Grupal (0 a 10) A partir de:
    • PORTFOLI DE L'ALUMNE: Document on s'explica el desenvolupament de la feina feta: plantejament del projecte, actes de reunions, informació buscada, explicació de l'aplicació implementada amb un petit manual d'usuari i proves i tests realitzats.
    • PRESENTACIÓ: Presentació oral en 5-7 transparències sobre el projecte desenvolupat i resultats obtinguts.
    • APLICACIÓ: programa desenvolupat.
    • ACTES i CONTROLS: Presentació de la documentació entregada.
  • Una avaluació individual a partir de les observacions fetes pels tutors en les sessions tutoritzades, on es tindrà en compte l'actitud, iniciativa, participació, assistència i puntualitat de l'alumne a les sessions de grup. Nota Individual (0 a 10).
  • Enquestes de co-avaluació i autoavaluació entre els membres del grup al final de cada projecte. Nota Coavaluació Companys (0 a 10).
  • Les presentacions orals es realitzen davant dels alumnes i els grups valoraran el treball dels seus companys a mode de ranking El grup que quedi en 1a possició rebrà 10 punts, el 2on 8 punts i així successivament.  Nota Coavaluació Classe (0 a 10).

 

Qualificacions

Cada projecte tindrà una nota que es calcularà de la següent manera: 

Nota Projecte =  0,5 * Nota Grupal +  0,3 * Nota Individual + 0,1 * Nota Coavaluació Companys + 0,1 * Nota Coavaluació Classe

 

La nota final sortirà del la mitjana ponderada dels projectes realitzats. La ponderació serà la mateixa per tots els projectes 

 

Per a distingir entre ‘suspens’ i ‘no presentat’ es fixa una data límit per a que els estudiants es puguin donar de baixa de l'avaluació, en el qual cas apareixeran com a ‘no presentats’. Per a donar-se de baixa caldrà comunicar-ho al professor, per escrit o mitjançant correu eletrònic, i obtenir un acús de rebuda.

 

Avaluació Única

Aquesta assignatura no preveu el sistema d’avaluació única. 

 


Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Nota Coavaluació Classe 10% 0 0 3, 8
Nota Coavaluació Companys 10% 0 0 3, 8
Nota Grupal 50% 5 0,2 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13
Nota Individual 30% 0 0 4, 5, 6, 8, 9, 10, 11, 13

Bibliografia

- Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd Edition. Springer (Texts in computer Science) 2021. (http://szeliski.org/Book/)

- Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)

- Adrian Kaehler, Gary Bradsky, Learning OpenCV 3: Computer Vision in C++ with the OpenCV Library, O'Reilly, 2016.

- Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.

- Eli Stevens, Luca Antiga, Thomas Viehmann, Deep learning with Pytorch, Manning Publications, 2020 (https://pytorch.org/assets/deep-learning/Deep-Learning-with-PyTorch.pdf)

- François Chollet, Deep learning with Python, Manning Publications, 2021 (https://github.com/fchollet/deep-learning-with-python-notebooks)


Programari

Per desenvolupar diferents sistemes de visió per computador, tan a pràctiques com a problemes, s'utilitzarà el llenguatge de programació Python, treballant amb Jupyter Notebooks.