Logo UAB
2022/2023

Estadística i Anàlisi de Dades

Codi: 44079 Crèdits: 9
Titulació Tipus Curs Semestre
4313861 Física d'Altes Energies, Astrofísica i Cosmologia / High Energy Physics, Astrophysics and Cosmology OB 0 1

Professor/a de contacte

Nom:
Francisco Javier Rico Castro
Correu electrònic:
franciscojavier.rico@uab.cat

Utilització d'idiomes a l'assignatura

Llengua vehicular majoritària:
anglès (eng)

Equip docent

Ramon Miquel Pascual
Abelardo Moralejo Olaizola
Jorge Carretero Palacios
Pau Tallada Crespí
Martin Borstad Eriksen
Francesc d'Assis Torradeflot Curero

Prerequisits

Per al "Bootcamp" de Python (part 2), és molt necessari portar un ordinador portàtil personal amb una instal·lació en execució de Python 3.9.

Per a això, instal·leu Python 3.9 amb l'Anaconda intaller. D'aquesta manera, la vostra distribució de Python contindrà tots els paquets associats necessaris per a aquest curs.

Seguiu aquests passos:

1. Descarregueu el programa d’instal·lació d'Anaconda per a Python 3.9 https://www.anaconda.com/download/

2. Seguiu les instruccions d’instal·lació: les versions de la interfície d’interfície gràfica o de la terminal funcionen bé. Si se us demana, seleccioneu l'opció per afegir el directori anaconda nou a la vostra ruta.

Es recomana l’ús de Linux o Mac.

Objectius

En aquest curs aprendrem a destil·lar coneixements científics a partir de dades experimentals, un procés que es basa en mètodes estadístics. Aprendrem els conceptes bàsics de probabilitat i estadística (en els seus marcs freqüentistes i bayesians). A més, estudiarem i practicarem diversos mètodes estadístics i tècniques d’anàlisi de dades que s’utilitzen habitualment en els camps de la Física d’Altes Energies, Astrofísica i Cosmologia. Amb aquest objectiu, aprendrem i practicarem l’ús d’estadístiques modernes i eines de programari d’anàlisi.

Competències

  • Que els estudiants sàpiguen aplicar els coneixements adquirits i la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
  • Treballar en grup, assumir responsabilitats compartides i interaccionar professionalment i de manera constructiva amb altres persones amb un respecte absolut als seus drets.
  • Utilitzar les matemàtiques per descriure el món físic, seleccionar les equacions apropiades, construir models adequats, interpretar resultats matemàtics i comparar críticament amb experimentació i observació.
  • Utilitzar programari adequat, llenguatges de programació i paquets informàtics en la investigació de problemes relacionats amb la física d'altes energies, l'astrofísica o la cosmologia.

Resultats d'aprenentatge

  1. Aplicar les tècniques d'anàlisi de dades a problemes tant de l'àmbit de la física de partícules, l'astrofísica i la cosmologia com d'àmbits propers però diferents.
  2. Aprendre el funcionament de programes informàtics d'anàlisi estadística.
  3. Treballar en petits grups per resoldre problemes d'anàlisi de dades.
  4. Utilitzar les tècniques Monte Carlo per a modelar problemes reals de Física.

Continguts

Part 1: Conceptes bàsics sobre tècniques de probabilitat, estadística i Monte Carlo

Part 2: Python per a estadístiques i anàlisi de dades

Part 3: Estimació de paràmetres, prova d'hipòtesi i "Unfolding"

Part 4: Estadístique Bayesiane

Metodologia

  • Classes teòriques que inclouen exemples pràctics en els camps de la Física d'Altes Energies, Astrofísica i Cosmologia
  • Exercicis i tasques que hauran de resoldre els estudiants sols o en grups petits
  • Discussió de problemes durant les classes i tutories
  • Sessions presencials sobre eines de programari per a estadístiques i anàlisi de dades (en llenguatge de programació Python)
  • Explicació i discussió de codis de mostra / algorismes en llenguatges de programació de Python durant les classes i tutorials
 

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.

Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Clases 56 2,24 1, 2, 4
Estudi de la teoria i exemples pràctics 40 1,6 1, 2, 3, 4
Tipus: Autònomes      
Discussió, grups de treball, resolució de problemes 34 1,36 1, 2, 3, 4

Avaluació


  • Assistència i participació activa a les classes teòriques
  • Resolució, per a cadascuna de les parts del curs, d’exercicis específics per a portar-se a casa
  • Resolució d'un examen final de síntesi
Per a aquells estudiants que no superin el curs després del procediment regular d'avaluació, hi haurà una ronda d'avaluació de la recuperació que consistirà també en exercicis específics per a les diferents parts del curs i un examen final de síntesi. No hi haurà marca de llindar que pugui optar a la ronda d’avaluació de la recuperació, llevat del requisit general d’haver estat avaluat almenys per un 66% de les activitats totals de qualificació en la primera ronda.

Activitats d'avaluació

Títol Pes Hores ECTS Resultats d'aprenentatge
Assistència i participació activa a les classes 5% 0 0 1, 2, 4
Resolució d'un examen de síntesi final 50% 50 2 1, 2, 3, 4
Resolució dels exercicis de classe 45% 45 1,8 1, 2, 3, 4

Bibliografia

  • G. Cowan; "Statistical Data Analysis", 1998, Oxford University Press
  • P. A. Zyla et al. (Particle Data Group); "Review of Partcle Physcis (2021)", Prog. Theor. Exp. Phys. 2020, 083C01 (2020) and 2021 update
  • F. James; "Statistical Methods in Experimental Physics", 2nd Edition, 2006, World Scientific
  • L. Lyons, "Statistics for Particle and Nuclear Physicists", 1986, Cambridge University Press
  • B. P. Roe, "Probability and Statistics in Experimental Physics", 1992, Springer
  • A. G. Frodesen, et al., "Probability and statistics in particle physics", 1979, Columbia University Press D. Sivia and J. Skilling, "Data Analysis, A Bayesian Tutorial", 2nd ed., 2006, Oxford University Press A. Gelman, "Bayesian Data Analysis", 1995, CRC Press
  • R. J. Barlow, "Statistics", 1989, J. Wiley
  • W.T. Press et al., "Numerical Recipes: The Art of Scientific Computing", Cambridge University Press. E.T. Jaynes, "Probability Theory: The Logic of Science", Cambridge University Press.
  • A. Stuart et al., "Kendall's Advanced Theory of Statistics", Vol 2A. Wiley.
  • F. James, "Monte Carlo Theory and Practice", Rep. Prog. Phys. 43 (1980) 73.

Programari

Introduirem i farem ús de el llenguatge de programació Python (vegeu la secció "Prerequisits" per obtenir informació detallada sobre la instal·lació)

En particular, estudiarem i farem servir les següents llibreries Python: NumPy, pandas, matplotlib, SciPy i scikit learn