Anàlisi de Dades Complexes
Codi: 104399
Crèdits: 6
2024/2025
| Titulació |
Tipus |
Curs |
| 2503740 Matemàtica Computacional i Analítica de Dades |
OB |
2 |
Idiomes dels grups
Podeu consultar aquesta informació al final del document.
Prerequisits
Es recomana tenir coneixements de probabilitat i inferència estadística així com una certa pràctica amb el software R.
Objectius
El principal objectiu és proporcionar eines estadístiques per a l'anàlisi de dades, dominant les tècniques més rellevants per a poder enfrontar-se amb models complexes.
Resultats d'aprenentatge
- CM14 (Competència) Implementar estratègies per a confirmar o refutar hipòtesis.
- CM15 (Competència) Gestionar la informació per a validar-la mitjançant un tractament estadístic.
- CM15 (Competència) Gestionar la informació per a validar-la mitjançant un tractament estadístic.
- CM16 (Competència) Avaluar, a partir de les dades obtingudes, les desigualtats per raó de sexe o gènere.
- KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
- KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
- KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
- KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
- KM14 (Coneixement) Identificar la utilitat dels mètodes bayesians, aplicant-los quan escaigui.
- KM14 (Coneixement) Identificar la utilitat dels mètodes bayesians, aplicant-los quan escaigui.
- SM14 (Habilitat) Utilitzar les propietats de les funcions de densitat i de distribució.
- SM14 (Habilitat) Utilitzar les propietats de les funcions de densitat i de distribució.
- SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.
- SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.
- SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.
Continguts
Tema 1- Models lineals: regressió múltiple i ANOVA.
Tema 2- Models lineals generalitzats: regressió logística i de Poisson.
Tema 3- Regularització: Models lasso i ridge.
Tema 4- Tècniques de Big Data en model lineals i models lineals generalitzats.
Tema 5- Tècniques de remostreig: Tests permutacionals i Bootstrap.
Activitats formatives i Metodologia
| Títol |
Hores |
ECTS |
Resultats d'aprenentatge |
| Tipus: Dirigides |
|
|
|
| Classes de Teoria |
24
|
0,96 |
|
| Classes de problemes |
20
|
0,8 |
|
| Tipus: Supervisades |
|
|
|
| Sessions pràctiques |
20
|
0,8 |
|
| Tipus: Autònomes |
|
|
|
| Treball personal |
61
|
2,44 |
|
D'acord amb els objectius de l'assignatura, el desenvolupament del curs es basa en les següents activitats:
- Classes de teoria: L'alumne adquireix els coneixements científic-tècnics propis de l'assignatura assistint a les classes de teoria i complementant-les amb l'estudi personal dels temes introduïts. Les classes de teoria són les activitats en les quals s'exigeix menys interactivitat a l'estudiant: estan concebudes com un mètode fonamentalment unidireccional de transmissió de coneixements del professor a l'alumne. Les classes es faran utilitzant un suport de diapositives en anglès que es penjaran també al Campus Virtual.
- Classes de problemes i pràctiques: Els problemes i les pràctiques són sessions amb una doble missió. D'una banda, es treballen els coneixements científic-tècnics introduïts en les sessions de teoria per a completar la seva comprensió i aprofundir en ells desenvolupant activitats diverses, des de la típica resolució de problemes fins a la discussió de casos pràctics. D'altra banda, les classes de problemes són el fòrum natural en el qual discutir en comú el desenvolupament del treball pràctic, aportant els coneixements necessaris per a portar-lo endavant, o indicant on i com es poden adquirir.
El curs pràctic d'aquesta assignatura es planteja com un camí per a orientar l'estudiant en un treball de camp d'estadística en cadascuna de les seves etapes. Així realitzen pel seu compte amb el software R uns exercicis pràctics dirigits aresoldre problemes reals concrets. Aquest plantejament està orientat a promoure un aprenentatge actiu i a desenvolupar el raonament crític i la capacitat d'anàlisi i síntesi.
Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.
Avaluació
Activitats d'avaluació continuada
| Títol |
Pes |
Hores |
ECTS |
Resultats d'aprenentatge |
| Examen parcial 1 |
35 |
2,5
|
0,1 |
CM15, KM12, SM14
|
| Examen parcial 2 |
35 |
2,5
|
0,1 |
CM15, KM12, SM14
|
| Exercicis |
30 |
20
|
0,8 |
CM14, CM15, CM16, KM12, KM14, SM14, SM15
|
L'avaluació es realitza al llarg de tot el curs. L'avaluació continuada té diversos objectius fonamentals: Monitoritzar el procés d'ensenyament i aprenentatge, permetent tant a l'alumne com al professor conèixer el grau d'assoliment de les competències i corregir, si és possible, les desviacions que es produeixin. Incentivar l'esforç continuat de l'alumne enfront del sobreesforç, sovint inútil, d'última hora. Verificar que l'alumne ha assolit les competències determinades en el pla d'estudis.
Per a fer aquesta avaluació es compta amb els següents instruments: Els exercicis pràctics lliurats pels estudiants (30%), un examen parcial de teoria al mig del curs (35%), un altre examen parcial de teoria al final del curs (35%). A la recuperació només podran anar els alumnes que tinguin un mínim de 3 en la nota final, recuperant només la part de teoria. A l'examen de recuperació no es pot apujar nota.
L'alumnat que s'hagi acollit a la modalitat d'avaluació única haurà de dur a terme una prova final que consistirà en un examen on hi podran haver qüestions de teoria i resolució de problemes, i un examen de pràctiques davant l'ordinador. Aquesta prova es realitzarà el mateix dia, hora i lloc que es faci la prova del segon parcial. Qui no es presenti a aquesta prova sense causa justificada, obtindrà la qualificació de NO AVALUABLE. Si s'obté una nota inferior a 5, es podrà recuperar el mateix dia, hora i lloc que es realitzi la recuperació de la resta d'alumnes del curs.
Bibliografia
- Introduction to Linear Regression Analysis. Montgomery, D. Peck, A. Vining, G., 2001.
- An R Companion to Linear Statistical Models. Christopher Hay-Jahans, 2012.
- Generalized Linear Models. McCullagh, P. and Nelder, J., 1992.
- The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Hastie T., Tibshirani, R., Friedman, J. 2009.
- Resampling methods: a practical guide to data Analysis. Phillip I. Good, 2006.
- The jackknife, the bootstrap and other resampling plans. Bradley Efron, 1982.
- Bootstrap methods and their application. A.C. Davison, D.V. Hinkley, 1997.
Programari
Es farà servi el programari R.
Llista d'idiomes
| Nom |
Grup |
Idioma |
Semestre |
Torn |
| (PLAB) Pràctiques de laboratori |
1 |
Català/Espanyol |
segon quadrimestre |
matí-mixt |
| (SEM) Seminaris |
1 |
Català/Espanyol |
segon quadrimestre |
matí-mixt |
| (TE) Teoria |
1 |
Català/Espanyol |
segon quadrimestre |
matí-mixt |