Logo UAB

Modelització de Dades Complexes

Codi: 104864 Crèdits: 6
2024/2025
Titulació Tipus Curs
2503852 Estadística Aplicada OB 3

Professor/a de contacte

Nom:
Rosario Delgado De la Torre
Correu electrònic:
rosario.delgado@uab.cat

Equip docent

Rosario Delgado De la Torre

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Es suposa que l'alumne que cursa aquesta assignatura ha adquirit les competències pròpies de les assignatures de

  • Càlcul 1,
  • Eines informàtiques per a l'Estadística i Introducció a la Programació,
  • Introducció a la Probabilitat i Inferència Estdística 1, i
  • Aprenentatge Automàtic 1.

Caldrà un bon nivell i pràctica en la programació amb R.


Objectius

Aprendre què són i com es fan servir les Xarxes Bayesianes: són un model probabilístic que es fa servir a l'Aprenentatge Automàtic Supervisat i que descriu les relacions de tipus probabilístic entre les variables que afecten determinat fenomen d'interès (que pot ser un sistema complex) i es poden fer servir com a classificadors. 

Entendre com les Xarxes Bayesianes es fan servir per avaluar i quantificar riscos, entre altres aplicacions.

Conèixer diferents metodologies que s'hauran d'aplicar, o no, quan es treballi amb aquests models, dependent de les seves característiques, en la fase de pre-procés de la base de dades o bé en la fase de construcció del model predictiu.

Conèixer diferents mètriques de comportament per a fer la validació del model i entendre la seva utilitat i adequació, en funció de les característiques de la base de dades.

Aprendre com construir scripts de R que permetin aprendre aquests models a partir d'una base de dades i fer la seva validació, fent servir les llibreries pertinents. Aplicar-ho amb dades reals.


Resultats d'aprenentatge

  1. CM09 (Competència) Valorar l'adequació dels models amb la utilització i interpretació correcta d'indicadors i gràfics.
  2. CM09 (Competència) Valorar l'adequació dels models amb la utilització i interpretació correcta d'indicadors i gràfics.
  3. CM10 (Competència) Modificar el programari existent, si el model estadístic proposat ho requereix, o crear un nou programari, si és necessari.
  4. KM12 (Coneixement) Proporcionar les hipòtesis experimentals de la modelització, tenint en compte les implicacions tècniques i ètiques que s'hi relacionen.
  5. KM12 (Coneixement) Proporcionar les hipòtesis experimentals de la modelització, tenint en compte les implicacions tècniques i ètiques que s'hi relacionen.
  6. SM12 (Habilitat) Interpretar els resultats obtinguts per a formular conclusions sobre les hipòtesis experimentals.
  7. SM13 (Habilitat) Comparar el grau d'ajust entre diversos models estadístics.
  8. SM14 (Habilitat) Utilitzar gràfics de visualització de l'ajust i de l'adequació del model.

Continguts

  1. Introducció a les Xarxes Bayesianes (XBs).
    Definició.
    Inferència amb XBs.
    Aprenentatge de XBs (tant d'estructura com de paràmetres).
  2. Les XB com a classificadors.
    La tasca de classificació dins l'Aprenentatge Automàtic Supervisat.
    El criteri MAP.
    Tipus de XB (Naive Bayes, Augmented Naive, TAN).
    Tipus de classificació: binària, multi-class, multi-label.
  3. La validació i les mètriques que comportament.
    Validació creuada.
    Mètriques pel cas binari i multi-class.
    Mètriques pel cas de classificació ordinal.
  4. Altres aspectes.
    Classificació multi-dimensional.
    Ensembles de classificadors.
    El "concept drive" i les XBs dinàmiques.
    XBs gaussianes i híbrides.
    Classificació multi-instance.

Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Problemes 14 0,56
Pràctiques (lliuraments, controls) 12 0,48
Teoria 26 1,04
Tipus: Supervisades      
Tutories 10 0,4
Tipus: Autònomes      
Estudi i pensar problemes 40 1,6
Treball pràctic amb instruments informàtics 30 1,2

L’assignatura s’estructura a partir de classes teòriques, de problemes i de pràctiques. El seguiment de l’assignatura és presencial, però caldrà ampliar les explicacions del professor amb l’estudi autònom de l’alumne, amb el suport de la bibliografia de referència i del material facilitat pel professor.

La classe de problemes es dedicaran a la resolució orientada d’alguns problemes proposats. A les classes pràctiques es treballarà amb R i les seves llibreries. Es valorarà especialment la participació dels estudiants a les classes de problemes i pràctiques.

 

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Examen 60% 3 0,12 CM09, SM12, SM13
PAC1 20% 6 0,24 CM09, CM10, KM12, SM12, SM13, SM14
PAC2 20% 9 0,36 CM09, SM13

La qualificació final d'aquesta assignatura s'obté com la mitjana ponderada de les notes de:

  • PAC1 (20%)
  • PAC2 (20%)
  • Examen (60%)

Les proves davaluació contínua PAC1 i PAC2 consisteixen en un lliurament de problemes/exercicis de pràctiques/treballs amb R, que es concretaran al llarg del curs, i en el seu desenvolupament en les classes presencials al llarg del semestre. 

Només es tindran en compte en el càlcul de la mitjana ponderada aquelles notes que siguin com a mínim 3.5 sobre 10 (les que no ho compleixin ponderaran 0).

Per a superar l'assignatura cal que aquesta mitjana sigui almenys 5.0 sobre 10.

Si no es supera l'assignatura en primera convocatòria, l'alumne es pot presentar a recuperació. L'examen de recuperació representa el 100% de la nota final per a aquells alumnes que es presenten a la recuperació, que només poden ser alumnes que no han superat l'assignatura a la primera convocatòria (l'examen de recuperació no serveix per a millorar la nota d'alumnes que ja han aprovat).

Es considera avaluable l'alumne que hagi presentat els lliuraments PAC1 o PAC2, o s'hagi presentat a l'examen o l'examen de recuperació. En cas contrari constarà a l'acta com a No Avaluable.

Per a l'eventual assignació de Matrícules d'Honor no es tindran en compte les notes de la segona convocatòria.


Bibliografia

  • Norman Fenton and Martin Neil, "Risk Assessment and Decision Analysis with Bayesian Networks", CRC Press. A Chapman & Hall Book, 2013. (Disponible en línia)
  • Radhakrishnan Nagarajan, Marco Scutari and Sophie Lèbre, "Bayesian Networks in R with applications in Systems Biology", Springer, 2013. (Disponible en línia)
  • Oliver Pourret, Patrick Naïm and Bruce Marcot, "Bayesian Networks. A practical guide to Applications", Series: Statistics in Practice. Wiley, 2008. (Disponible en línia)
  • Richard E. Neapolitan, "Learning Bayesian Networks", Prentice Hall Series in Artificial Intelligence, 2004.
  • Adnan Darwiche, "Modeling and reasoning with Bayesian networks", Cambridge, 2009.
  • Kevin B. Korb and Ann E. Nicholson, "Bayesian Artificial Intelligence" (2nd edition), Series: Computer Science and Data Analysis. CRC Press. A Chapman & Hall book, 2011. (Disponible en línia) 
  • Daphne Koller and Nir Friedman, "Probabilistic Graphical Models", The MIT Press Cambridge, Massachusetts London, England, 2009. http://mcb111.org/w06/KollerFriedman.pdf
  • Radhakrishnan Nagarajan, Marco Scutari and Sophie Lèbre, "Bayesian Networks in R with applications in systems biology", Series: Use R! Springer, 2013. (Disponible en línia) 
  • Marco Scutari and Jean-Baptiste Denis, "Bayesian networks with examples in R", Series: Texts in Statistical Science. CRC Press. A Chapman & Hall Book, 2015. 

Programari

Es farà servir el programari R amb algunes llibreries que s'indicaran oportunament al llarg del curs. Preferiblement en l'entorn RStudio.


Llista d'idiomes

Nom Grup Idioma Semestre Torn
(PLAB) Pràctiques de laboratori 1 Català segon quadrimestre tarda
(TE) Teoria 1 Català segon quadrimestre tarda