Aquesta versió de la guia docent és provisional fins que no finalitzi el període d’edició de les guies del nou curs.

Logo UAB

Modelització i Inferència

Codi: 104392 Crèdits: 6
2024/2025
Titulació Tipus Curs
2503740 Matemàtica Computacional i Analítica de Dades OB 2

Professor/a de contacte

Nom:
Rosario Delgado De la Torre
Correu electrònic:
rosario.delgado@uab.cat

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Es considera molt important un bon coneixement dels continguts de les assignatures cursades durant el primer curs, especialment les de probabilitat i càlcul. 


Objectius

Aquesta assignatura és la primera del Grau dedicada a la Inferència Estadística, que és la part de l'Estadística que permet obtenir, de manera controlada, informació sobre una població a partir de les dades d'una mostra "representativa". L'assignatura té un caràcter central dins dels estudis, ja que s'hi presenten conceptes i tècniques que seran emprades en moltes de les matèries que es cursaran a partir d'ara. Concretament, es començarà fent una introducció a l'Estadística, i després es tractarà l'estimació de paràmetres, tan puntual com per intervals de confiança, així com els tests d'hipòtesis paramètrics clàssics per a una i dues poblacions normals i dicotòmiques, i contrastos d'independència. Finalment, s'introduirà el model de regressió lineal simple. Es farà èmfasi especial en el mètodes estadístics que es poden fer servir per a comparar algorismes d'aprenentatge automàtic. 

La presencialitat de la docència i de les activitats avaluables s'adaptarà seguint les recomanacions de les autoritats sanitàries, per tal de garantir la seguretat de totes les persones.

 


Resultats d'aprenentatge

  1. CM14 (Competència) Implementar estratègies per a confirmar o refutar hipòtesis.
  2. CM15 (Competència) Gestionar la informació per a validar-la mitjançant un tractament estadístic.
  3. CM15 (Competència) Gestionar la informació per a validar-la mitjançant un tractament estadístic.
  4. CM16 (Competència) Avaluar, a partir de les dades obtingudes, les desigualtats per raó de sexe o gènere.
  5. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  6. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  7. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  8. KM12 (Coneixement) Identificar la inferència estadística com a instrument de pronòstic i predicció.
  9. KM13 (Coneixement) Descriure les propietats bàsiques dels estimadors de puntuals i d'interval.
  10. KM13 (Coneixement) Descriure les propietats bàsiques dels estimadors de puntuals i d'interval.
  11. KM14 (Coneixement) Identificar la utilitat dels mètodes bayesians, aplicant-los quan escaigui.
  12. KM14 (Coneixement) Identificar la utilitat dels mètodes bayesians, aplicant-los quan escaigui.
  13. SM14 (Habilitat) Utilitzar les propietats de les funcions de densitat i de distribució.
  14. SM14 (Habilitat) Utilitzar les propietats de les funcions de densitat i de distribució.
  15. SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.
  16. SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.
  17. SM15 (Habilitat) Utilitzar el programari estadístic adequat per a gestionar bases de dades, obtenir índexs de resum de les variables de l'estudi i analitzar les dades mitjançant tècniques d'inferència.

Continguts

Preliminars de Probabilitat (recordatori): Probabilitat i variables aleatòries. Concepte de llei. Distribucions

discretes. Funció de densitat i de probabilitat. Esperança i variància. Funció generatriu de moments. Exemples.

Tema 1. Introducció a l'Estadística.

1. Estadística descriptiva i estadística inferencial.

1.1. Conceptes bàsics en inferència: població estadística i mostra; paràmetres, estadístics i estimadors.

1.2. Models estadístics: paramètrics i no paramètrics.

2. Estadístics més usuals: els moments mostrals. Els estadístics d'ordre.

3. Distribució d'alguns estadístics.

3.1. D'una mostra d'una població Normal: Teorema de Fisher.

3.2. El Teorema Central del Límit: normalitat asimptòtica dels moments mostrals i de la proporció

Tema 2: Estimació puntual.

1. Estimadors puntuals: definició i propietats.

1.1. Biaix.

1.2. Comparació d'estimadors sense biaix. Eficiència relativa.

1.3. Comparació d'estimadors amb biaix: l'error quadràtic mitjà.

1.4. Consistència d'un estimador.

2. Mètodes per a obtenir estimadors.

2.1. Mètode dels moments.

2.2. Mètode de la MàximaVersemblança (EMV)

Tema 3. Estimació per intervals de confiança.

1. Concepte d'interval de confiança.

2. El mètode del "pivot" per a la construcció d'intervals de confiança.

3. Intervals de confiança per als paràmetres d'una població.

3.1. Per a la mitjana d'una població Normal amb desviació coneguda i desconeguda.

3.2. Per a la variància d'una població Normal amb mitjana desconeguda i coneguda.

3.3. Altres aplicacions del mètode del pivot.

3.4. Intervals de confiança assimptòtics. 

4. Intervals de confiança per als paràmetres de dues poblacions.

4.1. Intervals de confiança amb mostres independents.

4.2. Intervals de confiança per a la diferència de mitjanes de dues poblacions Normals amb dades aparellades.

Tema 4: Tests d'hipòtesis.

1. Introducció.

1.1. Errors tipus I i II.

1.2. Funció potència.

1.3.Consistència dels tests.

1.4. p-valors.

1.5. Dualitat entre intervals de confiança i tests d'hipòtesis.

2. Tests per als paràmetres d'una població.

2.1. Per a la mitjana d'una població Normal amb desviació coneguda i desconeguda.

2.2. Tests assimptòtics per a la mitjana d'una població quan la mostra és gran.

2.3. Per a la variància d'una població Normal.

3. Tests per als paràmetres de dues poblacions.

3.1. Tests d'hipòtesis amb mostres independents.

3.2. Tests d'hipòtesis amb dades aparellades.

4. Proves de la khi-quadrat.

4.1. De bondat d'ajustament.

4.2. D'independència.

5. Tests no paramètrics per a comparar algorismes d'aprenentatge automàtic. 

Tema 5. Regressió lineal simple.

1. Objectius del model.

2. Estimadors de mínims quadrats ordinaris (MQO).

3. Inferència amb el model de regressió simple.

4. Prediccions.

IMPORTANT: En la docència, la perspectiva de gènere implica revisar els biaixos androcèntrics i qüestionar els supòsits i estereotips de gènere ocults. Aquesta revisió comporta incloure als continguts de l'assignatura el coneixement produït per les dones científiques, sovint oblidades, procurant el reconeixement de les seves aportacions, així com el de les seves obres a les referències bibliogràfiques


Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classes de problemes 12 0,48
Classes de pràctiques 10 0,4
Classes de teoria 27 1,08
Tipus: Autònomes      
Exàmens 15 0,6
Resolució de problemes 33 1,32
Resolució de pràctiques 23 0,92

L'assignatura s'estructura a partir de classes de teoria, problemes i pràctiques.

A les classes de teoria anirem introduint els conceptes i tècniques que descriu el programa del curs. Donat el seu contingut estàndard d'un primer curs d'inferència estadística, es pot seguir fent us de la bibliografia bàsica recomanada. També s'anirà penjant al Campus Virtual el material corresponent a cada tema explicat a les classes presencials.

Les classes de problemes tenen per objectiu treballar i entendre els conceptes estadístics. Al Campus Virtual es penjaran les llistes de problemes.

L'objectiu de les pràctiques és la utilització de programari estadístic R, per a obtenir i aclarar els resultats dels procediments que s'han introduït a les classes de teoria i problemes. Al Campus Virtual es penjarà l'enunciat de cada pràctica amb antelació.

IMPORTANT: Per a treballar més còmodament amb R, es recomana fer servir l'interface RStudio: és lliure, "open source" i funciona amb Windows, Mac i Linux. https://www.rstudio.com/

OBSERVACIÓ: La perspectiva de gènere en la docència va més enllà dels continguts de les assignatures, ja que també implica una revisió de les metodologies docents i de les interaccions entre l'alumnat i el professorat, tant a l'aula com a fora. En aquest sentit, les metodologies docents participatives, on es genera un entorn igualitari, menys jeràrquic a l'aula, evitant exemples estereotipats en gènere i vocabulari sexista, amb l'objectiu de desenvolupar elraonament crítici el respecte a la diversitat i pluralitat d'idees, persones i situacions, solen ser més favorables a la integració i plena participació de les alumnes a l'aula, i per això es procurarà la seva implementació efectiva en aquesta assignatura.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Examen final 0,60 10 0,4 CM14, KM12, KM13, KM14, SM14
PAC1: Examen parcial 0,25 8 0,32 CM14, KM12, KM13, KM14, SM14
PAC2: Exercicis avaluables 0,15 12 0,48 CM15, CM16, SM15

A les classes de teoria s'introduiran els conceptes bàsics de l'assignatura i es presentarà un ampli conjunt d'exemples. A les classes de problemes i pràctiques, es resoldran exercicis i es faran pràctiques amb R. Es recomana l'assistència a classe per tenir una idea sobre el curs en general, així com dels exercicis i pràctiques.

 

Avaluació:

La qualificació de l'estudiant serà la mitjana ponderada de les activitats següents:

PAC1: examen parcial, que suposa el 25% de la nota.
PAC2: lliuraments d'exercicis relacionats amb les pràctiques d'ordinador amb R realitzats a l'aula, que suposa un 15% de la nota.
Examen final: que constarà d'algunes preguntes de tipus conceptual en forma de qüestions curtes i d'uns problemes on haurà de resoldre una sèrie d'exercicis similars als que s'han treballat a les sessions de classe. Aquesta prova suposa el 60% restant de la nota.

Important: si la nota d'alguna d'aquestes activitats no arriba al 3 sobre 10, comptarà com a 0 al còmput de la qualificació final.

Recuperació: si aquesta qualificació no arriba a 5, l'estudiant té dret a una altra oportunitat de superar l'assignatura mitjançant l'examen de recuperació. En aquesta prova es podrà recuperar el 85% de la nota corresponent a l'examen final i al PAC1. La part pràctica amb R (PAC2) no és recuperable. En cap cas l'examen de recuperació no pot servir per pujar la nota si l'alumne ja ha superat l'assignatura amb el primer examen.

____________________________________________________________________________

 

Avaluació única:

L'alumnat que s'hagi acollit a la modalitat davaluació única haurà de realitzar una prova final que consistirà enun examen que constarà d'algunes preguntes de tipus conceptual en forma de qüestions curtes i d'uns problemes en què haurà de resoldre una sèrie d'exercicis similars als que s'han treballat a les sessions de classe. Un cop finalitzat, lliurarà, a més de l'examen, els exercicis relacionats amb les pràctiques d'ordinador amb R realitzats al llarg del curs.

La qualificació de l'estudiant serà la mitjana ponderada de les dues activitats anteriors, on la prova final suposarà el 85% de la nota, i l'avaluació dels fulls de respostes de les pràctiques dordinador amb R el 15% restant.

Important: si la nota d'alguna d'aquestes activitats no arriba al 3 sobre 10, comptarà com a 0 al còmput de la qualificació final.

Si aquesta qualificació no arriba a 5, l'estudiant té dret a una altra oportunitat de superar l'assignatura mitjançant l'examen de recuperació que se celebrarà a la data que fixi la coordinació de la titulació. En aquesta prova es pot recuperar el 85% de la nota corresponent a la prova final. La part pràctica amb R no és recuperable. En cap cas l'examen de recuperació no pot servir per pujar la nota si l'alumne ja ha superat l'assignatura amb el primer examen.


Bibliografia

  1. Daalgard, P.: Introductory Statistics with R. Springer. 2008.
  2. Daniel, W.W.: Biostatistics. Wiley. 1974.
  3. DeGroot, M. H.: Schervish, M.J. Probability and Statistics. Pearson Academic. 2010.
  4. Delgado, R.: Probabilidad y Estadística con aplicaciones. 2018.
    https://www.amazon.es/Probabilidad-Estad%C3%ADstica-aplicaciones-Rosario-Delgado/dp/1983376906
  5. Heumann, C., Schomaker, M., Shalbh: Introduction to Statistics and Data Analysis: With Exercises, Solutions and Applications in R. Second Edition. Springer. 2023.
    Disponible on-line a través de la UAB: https://link.springer.com/book/10.1007/978-3-031-11833-3
  6. Plaue, M.: Data Science: An Introduction to Statistics and Machine Learning. Springer. 2023.
    Disponible on-line a través de la UAB: https://link.springer.com/book/10.1007/978-3-662-67882-4
  7. R Tutorial. An introduction to Statistics. https://cran.r-project.org/manuals.html
  8. Salsburg, D. The Lady tasting tea : how statistics revolutionized science in the twentieth century. 2002. ISBN-13: 978-0805071344
  9. Silvey, S.D.: Statistical Inference. Chapman&Hall. 1975.

https://app.jove.com/science-education/v/12796/introduction-to-statistics


Programari

R Core Team (2021). R: A language and environment for statistical computing. R
  Foundation for Statistical Computing, Vienna, Austria. URL
  https://www.R-project.org/.


Llista d'idiomes

Nom Grup Idioma Semestre Torn
(PLAB) Pràctiques de laboratori 1 Català primer quadrimestre matí-mixt
(SEM) Seminaris 1 Català primer quadrimestre matí-mixt
(TE) Teoria 1 Català primer quadrimestre matí-mixt