Logo UAB

Anàlisi de Dades Complexes

Codi: 104399 Crèdits: 6
2024/2025
Titulació Tipus Curs
2503740 Matemàtica Computacional i Analítica de Dades OB 2

Professor/a de contacte

Nom:
Amanda Fernandez Fontelo
Correu electrònic:
amanda.fernandez@uab.cat

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Es recomana tenir coneixements de probabilitat i inferència estadística així com una certa pràctica amb el software R.


Objectius

El principal objectiu és proporcionar eines estadístiques per a l'anàlisi de dades, dominant les tècniques més rellevants per a poder enfrontar-se amb models complexes.


Resultats d'aprenentatge

  1. CM14 (Competència) Implementar estratègies per a confirmar o refutar hipòtesis.
  2. CM15 (Competència) Gestionar la informació per a validar-la mitjançant un tractament estadístic.
  3. CM15 (Competència) Gestionar la informació per a validar-la mitjançant un tractament estadístic.
  4. CM16 (Competència) Avaluar, a partir de les dades obtingudes, les desigualtats per raó de sexe o gènere.
  5. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  6. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  7. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  8. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  9. KM14 (Coneixement) Identificar la utilitat dels mètodes bayesians, aplicant-los quan escaigui.
  10. KM14 (Coneixement) Identificar la utilitat dels mètodes bayesians, aplicant-los quan escaigui.
  11. SM14 (Habilitat) Utilitzar les propietats de les funcions de densitat i de distribució.
  12. SM14 (Habilitat) Utilitzar les propietats de les funcions de densitat i de distribució.
  13. SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.
  14. SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.
  15. SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.

Continguts

Tema 1- Models lineals: regressió múltiple i ANOVA.
Tema 2- Models lineals generalitzats: regressió logística i de Poisson.
Tema 3- Regularització: Models lasso i ridge.
Tema 4- Tècniques de Big Data en model lineals i models lineals generalitzats.
Tema 5Tècniques de remostreig: Tests permutacionals i Bootstrap.


Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classes de Teoria 24 0,96
Classes de problemes 20 0,8
Tipus: Supervisades      
Sessions pràctiques 20 0,8
Tipus: Autònomes      
Treball personal 61 2,44

D'acord amb els objectius de l'assignatura, el desenvolupament del curs es basa en les següents activitats:

  • Classes de teoria: L'alumne adquireix els coneixements científic-tècnics propis de l'assignatura assistint a les classes de teoria i complementant-les amb l'estudi personal dels temes introduïts. Les classes de teoria són les activitats en les quals s'exigeix menys interactivitat a l'estudiant: estan concebudes com un mètode fonamentalment unidireccional de transmissió de coneixements del professor a l'alumne. Les classes es faran utilitzant un suport de diapositives en anglès que es penjaran també al Campus Virtual. 
  • Classes de problemes i pràctiques: Els problemes i les pràctiques són sessions amb una doble missió. D'una banda, es treballen els coneixements científic-tècnics introduïts en les sessions de teoria per a completar la seva comprensió i aprofundir en ells desenvolupant activitats diverses, des de la típica resolució de problemes fins a la discussió de casos pràctics. D'altra banda, les classes de problemes són el fòrum natural en el qual discutir en comú el desenvolupament del treball pràctic, aportant els coneixements necessaris per a portar-lo endavant, o indicant on i com es poden adquirir.

El curs pràctic d'aquesta assignatura es planteja com un camí per a orientar l'estudiant en un treball de camp d'estadística en cadascuna de les seves etapes. Així realitzen pel seu compte amb el software R uns exercicis pràctics dirigits aresoldre problemes reals concrets. Aquest plantejament està orientat a promoure un aprenentatge actiu i a desenvolupar el raonament crític i la capacitat d'anàlisi i síntesi.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Examen parcial 1 35 2,5 0,1 CM15, KM12, SM14
Examen parcial 2 35 2,5 0,1 CM15, KM12, SM14
Exercicis 30 20 0,8 CM14, CM15, CM16, KM12, KM14, SM14, SM15

L'avaluació es realitza al llarg de tot el curs. L'avaluació continuada té diversos objectius fonamentals: Monitoritzar el procés d'ensenyament i aprenentatge, permetent tant a l'alumne com al professor conèixer el grau d'assoliment de les competències i corregir, si és possible, les desviacions que es produeixin. Incentivar l'esforç continuat de l'alumne enfront del sobreesforç, sovint inútil, d'última hora. Verificar que l'alumne ha assolit les competències determinades en el pla d'estudis.

Per a fer aquesta avaluació es compta amb els següents instruments: Els exercicis pràctics lliurats pels estudiants (30%), un examen parcial de teoria al mig del curs (35%), un altre examen parcial de teoria al final del curs (35%). A la recuperació només podran anar els alumnes que tinguin un mínim de 3 en la nota final, recuperant només la part de teoria. A l'examen de recuperació no es pot apujar nota.

L'alumnat que s'hagi acollit a la modalitat d'avaluació única haurà de dur a terme una prova final que consistirà en un examen on hi podran haver qüestions de teoria i resolució de problemes, i un examen de pràctiques davant l'ordinador. Aquesta prova es realitzarà el mateix dia, hora i lloc que es faci la prova del segon parcial. Qui no es presenti a aquesta prova sense causa justificada, obtindrà la qualificació de NO AVALUABLE. Si s'obté una nota inferior a 5, es podrà recuperar el mateix dia, hora i lloc que es realitzi la recuperació de la resta d'alumnes del curs.


Bibliografia

  • Introduction to Linear Regression Analysis. Montgomery, D. Peck, A. Vining, G., 2001.
  • An R Companion to Linear Statistical Models. Christopher Hay-Jahans, 2012.
  • Generalized Linear Models. McCullagh, P. and Nelder, J., 1992.
  • The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Hastie T., Tibshirani, R., Friedman, J. 2009. 
  • Resampling methods: a practical guide to data Analysis. Phillip I. Good, 2006.
  • The jackknife, the bootstrap and other resampling plans. Bradley Efron, 1982.
  • Bootstrap methods and their application. A.C. Davison, D.V. Hinkley, 1997.

Programari

Es farà servi el programari R.


Llista d'idiomes

Nom Grup Idioma Semestre Torn
(PLAB) Pràctiques de laboratori 1 Català/Espanyol segon quadrimestre matí-mixt
(SEM) Seminaris 1 Català/Espanyol segon quadrimestre matí-mixt
(TE) Teoria 1 Català/Espanyol segon quadrimestre matí-mixt