Logo UAB

Visió i Aprenentatge

Codi: 106582 Crèdits: 6
2025/2026
Titulació Tipus Curs
Intel·ligència Artificial / Artificial Intelligence OT 3
Intel·ligència Artificial / Artificial Intelligence OT 4

Professor/a de contacte

Nom:
Debora Gil Resina
Correu electrònic:
debora.gil@uab.cat

Equip docent

Guillermo Eduardo Torres
Debora Gil Resina

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Haver cursat les assignatures de Fonaments d'Aprenentatge Automàtic, Fonaments de Programació, Fonaments de Visió per Computador, Probabilitat i Estadística, i Xarxes Neuronals i Aprenentatge Profund.

Es recomana que l'alumne tingui coneixements i capacitats de:

  • Programació en el llenguatge de programació Python
  • Processament de Senyal, Imatge i Vídeo
  • Validació estadística
  • Aprenentatge Computacional i Deep Learning

Objectius

Aproximadament cada dècada hi ha un tsunami tecnològic que transforma múltiples indústries. La Intel·ligència Artificial (IA) és aquesta onada que arrasa al món tecnològic actual. Si alguna vegada t'has preguntat:

  • com els ordinadors realitzen la detecció de cares en multituds?
  • com les aplicacions de videotrucades desenfoquen el fons o reemplacen el fons amb altres imatges?
  • com es desplacen els cotxes autònoms de forma segura en un entorn urbà?
  • com es segueix la pilota amb tanta precisió en esdeveniments esportius televisats com tennis, futbol i bàsquet?
  • podem saber el tractament de càncer més efectiu a partir de dades multimodals del pacient?
  • podem saber les emocions d'una persona amb un video?
  • com aprenen les màquines?

Si hem despertat la seva curiositat, aquest curs és el que necessites. En aquest curs apendrem sobre temes en Visió per Ordinador com Seguiment d'Objectes, Classificació d'Imatges, Medicina Personalitzada, Detecció de Cares, Flux Òptic, estimació d'Pose Humana i molts més.

A diferència d'altres cursos de visió per ordinador, aquest curs s'acosta a la visió per ordinador de manera més pràctica, experiencial i intuïtiva. El seu principal component és un conjunt de projectes que ha de ser desenvolupats pels estudiants repartits en equips. Tot el que es necessita és un coneixement pràctic del llenguatge de programació Python. 

Utilitzarem python que permet incorporar diferents biblioteques de visió per ordinador. L’utilitzen milers d’empreses, productes i dispositius i es prova cada dia per obtenir escalabilitat i rendiment. A més apendrem a dissenyar i adaptar xarxes específiques i a escollir quin és el mètode de processat més adient segons els requeriments i restriccions de cada aplicació. 

En resum, Visió i Aprenentatge és una assignaturade caràcter eminentment pràctic i interdisciplinar que se situa en el pont que hi ha entre la intel·ligència artificial i el món real i que pretén recórrer aquest pont en ambdues direccions.


Competències

    Intel·ligència Artificial / Artificial Intelligence
  • Analitzar i resoldre problemes de manera efectiva, i generar propostes innovadores i creatives per aconseguir els objectius.
  • Conceptualitzar i modelar alternatives de solucions complexes per a problemes d’aplicació de la intel·ligència artificial en diferents àmbits, i planificar i gestionar projectes per al disseny i desenvolupament de prototips que demostrin la validesa del sistema proposat.
  • Desenvolupar pensament crític per analitzar de manera fonamentada i argumentada alternatives i propostes tant pròpies com alienes.
  • Elaborar estratègies per formular i solucionar diferents problemes d’aprenentatge de manera científica, creativa, crítica i sistemàtica, coneixent les capacitats i limitacions dels diferents mètodes i eines existents.
  • Introduir canvis en els mètodes i els processos de l’àmbit de coneixement per donar respostes innovadores a les necessitats i demandes de la societat. 
  • Que els estudiants sàpiguen aplicar els coneixements propis a la seva feina o vocació d'una manera professional i tinguin les competències que se solen demostrar per mitjà de l'elaboració i la defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi.
  • Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.

Resultats d'aprenentatge

  1. Analitzar i resoldre problemes de manera efectiva, i generar propostes innovadores i creatives per aconseguir els objectius.
  2. Analitzar una situació i identificar-ne els punts de millora.
  3. Desenvolupar pensament crític per analitzar de manera fonamentada i argumentada alternatives i propostes tant pròpies com alienes.
  4. Dissenyar les millors arquitectures de xarxes convolucionals per a la resolució de problemes de reconeixement visual d’objectes i escenes.
  5. Identificar els conceptes bàsics i aplicar de manera adequada les tècniques d’aprenentatge computacional al reconeixement en imatges.
  6. Planificar, desenvolupar, avaluar i implementar una solució per a un problema particular de reconeixement visual.
  7. Proposar nous mètodes o solucions alternatives fonamentades.
  8. Que els estudiants sàpiguen aplicar els coneixements propis a la seva feina o vocació d'una manera professional i tinguin les competències que se solen demostrar per mitjà de l'elaboració i la defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi.
  9. Seleccionar i dissenyar els millors conjunts de dades per a l’entrenament de xarxes.
  10. Seleccionar i dissenyar els millors mètodes per a l’entrenament de xarxes neuronals.
  11. Seleccionar i dissenyar les millors tècniques per avaluar els resultats de l’entrenament de mètodes o xarxes.
  12. Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.
  13. Utilitzar tècniques d’aprenentatge computacional per planificar, desenvolupar, avaluar i implementar una solució per a un problema particular.

Continguts

1. Introducció a l'Aprenentatge Computacional en Visió per Computador

2. Classificació d'Imatges

3. Detecció d'Objectes

4. Segmentació de Regions

5. Indexació i Recuperació

6. Generació d'Imatges

7. Aprenentatge Multimodal

 


Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classes de teoria 10 0,4 5, 6, 9, 10, 11, 13
Tipus: Supervisades      
Taller de treball 20 0,8 1, 2, 4, 8, 9, 10, 11, 13
Tipus: Autònomes      
Treball personal 115 4,6 1, 2, 3, 4, 6, 7, 8, 12, 13

La gestió de la docència de l'assignatura es farà a través del gestor documental Caronte (http://caronte.uab.cat/), que servirà com a eina de gestió els equips de treball,  fer els lliuraments corresponents, veure les notes, comunicar-vos amb els professors, etc. Per poder-lo utilitzar cal fer els següents passos:

  1.  Donar-se d'alta com usuari donant el nom, NIU, i una foto carnet en format JPG. Si ja us heu donat d'alta per alguna altra assignatura, no cal tornar-ho a fer, podeu anar al següent pas.
  2.  Inscriure’s al tipus de docència "VISIÓ I APRENENTATGE", donant com a codi d'assignatura el proporcionat el primer dia de classe.

 

El curs seguirà una metodologia docent d'aprenentatge anomenada Aprenentatge Basat en Projectes (ABP). La metodologia ABP pretén potenciar i motivar a l'estudiant en el seu aprenentatge. Es formaran grups d'entre 5 i 6 estudiants als que se'ls encomanarà la realització d'un conjunt de projectes (de mida mitjana) al llarg del semestre. Es farà un seguiment setmanal i tutorització tant grupal com individual dels estudiants

Els projectes són fixats pel professorat de manera que compleixi les següents condicions:  ser el més real possible;  ser tractable mitjançant eines elementals; no tenir associat un algorisme de solució standard.

D'altra banda, és essencial entendre que no es tracta pas de trobar un algorisme que funcioni en el 100 x 100 dels casos —tot sovint no existeix tal cosa— sinó simplement de “donar-hi una proposta de solució raonable”.

Els projectes els han de desenvolupar cada equip amb la màxima autonomia possible. Cada equip tindrà assignat un tutor que en seguirà l'evolució però enprincipi s'abstindrà d'imposar les seves idees. D'altra banda, l'estudiant ha de tenir clar que no es tracta de buscar la ‘solució’ del problema en altres llocs, sino de fer una aportació original. Això no vol dir que s'hagi de renunciar a la informació que pugui existir en la bibliografia o a Internet; però quan se'n faci ús cal tenir informat el professor i explicar-ho en la memòria.

La realització del projecte ha de acabar en un programa i una memòria final. A més d'entregar-la en forma escrita, els resultats d'aquesta memòria seran objecte d'una exposició oral. Una i altra, memòria escrita i exposició oral, han d'anar dirigides principalment a l'entitat, segurament hipotètica, que hauria proposat el problema. Per regla general, els tecnicismes seran relegats a apartats concrets de la memòria escrita.

En les presentacions orals dels projectes s'espera que hi assisteixin tota la classes, i que aquests intervinguin mitjançant preguntes i observacions.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, perquè els alumnes completin les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Nota Grupal 60% 0 0 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13
Nota Individual 40% 5 0,2 1, 4, 5, 6, 8, 9, 10, 11, 13

L’assignatura té 2 acyivitats d’avaluació:

  1. Projectes grupals (60%)
  2. Proba escrita individual (40%)

 Avaluació dels Projectes

L’assignatura té 3 projectes de dificultat creixent. Al final de cada projecte els estudiants entregaran una memòria del treball realitzat que seran avaluats per part dels professors de l'assignatura siguin o no els tutors. Per a l'avaluació  s'utilitzaran els següents INSTRUMENTS i ACTIVITATS:

    • MEMORIA DEL PROJECTE  Document on s'explica el desenvolupament de la feina feta: plantejament del projecte, actes de reunions, informació buscada, explicació de l'aplicació implementada amb un petit manual d'usuari i proves i tests realitzats. És obligatori seguir el model proporcionat al CV, tant de forma, estructura com continguts de cada secció.
    • APLICACIÓ: programa desenvolupat.
    • SEGUIMENT A CLASSE: Avaluació a partir de les observacions fetes pels tutors en les sessions tutoritzades, on es tindrà en compte l'actitud, iniciativa, participació, assistència i puntualitat de l'alumne a les sessions de grup..

Donat que els projectes es desenvolupen al llarg de tot el curs, la seva avaluació té un caràcter continuat, i el seu resultat final no és recuperable.

Proba Individual

Al final del curs es farà una proba escrita individual on l’estudiant haurà de demostrar que ha entès els continguts i metodologies usades en els projectes realitzats.

Qualificacions

La nota de l’assignatura és la Mitjana ponderada entre la nota dels projectes i la nota de la proba individual:   

Nota Final =  0,6 * Nota Projectes +  0,4 * Nota Individual 

La nota dels projectes sortirà del la mitjana dels 3 projectes realitzats. Cal tenir un 5 en la Nota Individual per fer la mitjana. L’assignatura queda aprobada si la Nota Final >=5

Per a distingir entre ‘suspens’ i ‘no presentat’ es fixa una data límit per a que els estudiants es puguin donar de baixa de l'avaluació, en el qual cas apareixeran com a ‘no presentats’. Per a donar-se de baixa caldrà comunicar-ho al professor, per escrit o mitjançant correu eletrònic, i obtenir un acús de rebuda.

Si es demostra que part del contingut del projecte ha estat plagiat i/o elaborat per una tercera persona diferent de l'estudiant i/o generat per IA, es suspendrà automàticament.

Avaluació Única: Aquesta assignatura no preveu el sistema d’avaluació única. 

Ús d’IA. Les eines d’IA és podrán usar com eines de suport a l’aprenetatge (per exemple, per millorar la redacció, l’estil, la claredat expositiva, la correcció lingüística /oi per l'obtenció d'assistència en aspectes tècnics). En cap cas podrán substituir i/o suolantar l’activitat d’aprenentatge de l’estudiant, ni la seva adquisición dels coneixements específics de l’assignatura.

No és acceptable utilitzar eines d’intel·ligència artificial per generar continguts del treball que estan sotmesos a avaluació. Les tasques/activitats evaluables sospitoses d’haver estat generades per una IA enlloc de per l’estudiant serán considerades com una còpia i serán evaluades amb un 0.

 

 


Bibliografia

- Richard Szeliski, Computer Vision: Algorithms and Applications, 2nd Edition. Springer (Texts in computer Science) 2021. (http://szeliski.org/Book/)

- Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT Press, 2016. (http://www.deeplearningbook.org)

- Adrian Kaehler, Gary Bradsky, Learning OpenCV 3: Computer Vision in C++ with the OpenCV Library, O'Reilly, 2016.

- Aurélien Géron, Hands-On Machine Learning with Scikit-Learn & TensorFlow, O'Reilly, 2017.

- Eli Stevens, Luca Antiga, Thomas Viehmann, Deep learning with Pytorch, Manning Publications, 2020 (https://pytorch.org/assets/deep-learning/Deep-Learning-with-PyTorch.pdf)

- François Chollet, Deep learning with Python, Manning Publications, 2021 (https://github.com/fchollet/deep-learning-with-python-notebooks)


Programari

Per desenvolupar diferents sistemes de visió per computador, tan a pràctiques com a problemes, s'utilitzarà el llenguatge de programació Python, treballant amb Jupyter Notebooks.


Grups i idiomes de l'assignatura

La informació proporcionada és provisional fins al 30 de novembre de 2025. A partir d'aquesta data, podreu consultar l'idioma de cada grup a través d’aquest enllaç. Per accedir a la informació, caldrà introduir el CODI de l'assignatura

Nom Grup Idioma Semestre Torn
(PAUL) Pràctiques d'aula 711 Anglès primer quadrimestre tarda
(PLAB) Pràctiques de laboratori 711 Anglès primer quadrimestre tarda
(TE) Teoria 71 Anglès primer quadrimestre tarda