2022/2023
Estadística i Anàlisi de Dades
Codi: 44079
Crèdits: 9
Titulació |
Tipus |
Curs |
Semestre |
4313861 Física d'Altes Energies, Astrofísica i Cosmologia / High Energy Physics, Astrophysics and Cosmology |
OB |
0 |
1 |
Utilització d'idiomes a l'assignatura
- Llengua vehicular majoritària:
- anglès (eng)
Equip docent
- Ramon Miquel Pascual
- Abelardo Moralejo Olaizola
- Jorge Carretero Palacios
- Pau Tallada Crespí
- Martin Borstad Eriksen
- Francesc d'Assis Torradeflot Curero
Prerequisits
Per al "Bootcamp" de Python (part 2), és molt necessari portar un ordinador portàtil personal amb una instal·lació en execució de Python 3.9.
Per a això, instal·leu Python 3.9 amb l'Anaconda intaller. D'aquesta manera, la vostra distribució de Python contindrà tots els paquets associats necessaris per a aquest curs.
Seguiu aquests passos:
1. Descarregueu el programa d’instal·lació d'Anaconda per a Python 3.9 https://www.anaconda.com/download/
2. Seguiu les instruccions d’instal·lació: les versions de la interfície d’interfície gràfica o de la terminal funcionen bé. Si se us demana, seleccioneu l'opció per afegir el directori anaconda nou a la vostra ruta.
Es recomana l’ús de Linux o Mac.
Objectius
En aquest curs aprendrem a destil·lar coneixements científics a partir de dades experimentals, un procés que es basa en mètodes estadístics. Aprendrem els conceptes bàsics de probabilitat i estadística (en els seus marcs freqüentistes i bayesians). A més, estudiarem i practicarem diversos mètodes estadístics i tècniques d’anàlisi de dades que s’utilitzen habitualment en els camps de la Física d’Altes Energies, Astrofísica i Cosmologia. Amb aquest objectiu, aprendrem i practicarem l’ús d’estadístiques modernes i eines de programari d’anàlisi.
Competències
- Que els estudiants sàpiguen aplicar els coneixements adquirits i la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
- Treballar en grup, assumir responsabilitats compartides i interaccionar professionalment i de manera constructiva amb altres persones amb un respecte absolut als seus drets.
- Utilitzar les matemàtiques per descriure el món físic, seleccionar les equacions apropiades, construir models adequats, interpretar resultats matemàtics i comparar críticament amb experimentació i observació.
- Utilitzar programari adequat, llenguatges de programació i paquets informàtics en la investigació de problemes relacionats amb la física d'altes energies, l'astrofísica o la cosmologia.
Resultats d'aprenentatge
- Aplicar les tècniques d'anàlisi de dades a problemes tant de l'àmbit de la física de partícules, l'astrofísica i la cosmologia com d'àmbits propers però diferents.
- Aprendre el funcionament de programes informàtics d'anàlisi estadística.
- Treballar en petits grups per resoldre problemes d'anàlisi de dades.
- Utilitzar les tècniques Monte Carlo per a modelar problemes reals de Física.
Continguts
Part 1: Conceptes bàsics sobre tècniques de probabilitat, estadística i Monte Carlo
Part 2: Python per a estadístiques i anàlisi de dades
Part 3: Estimació de paràmetres, prova d'hipòtesi i "Unfolding"
Part 4: Estadístique Bayesiane
Metodologia
- Classes teòriques que inclouen exemples pràctics en els camps de la Física d'Altes Energies, Astrofísica i Cosmologia
- Exercicis i tasques que hauran de resoldre els estudiants sols o en grups petits
- Discussió de problemes durant les classes i tutories
- Sessions presencials sobre eines de programari per a estadístiques i anàlisi de dades (en llenguatge de programació Python)
- Explicació i discussió de codis de mostra / algorismes en llenguatges de programació de Python durant les classes i tutorials
Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.
Avaluació
- Assistència i participació activa a les classes teòriques
- Resolució, per a cadascuna de les parts del curs, d’exercicis específics per a portar-se a casa
- Resolució d'un examen final de síntesi
Per a aquells estudiants que no superin el curs després del procediment regular d'avaluació, hi haurà una ronda d'avaluació de la recuperació que consistirà també en exercicis específics per a les diferents parts del curs i un examen final de síntesi. No hi haurà marca de llindar que pugui optar a la ronda d’avaluació de la recuperació, llevat del requisit general d’haver estat avaluat almenys per un 66% de les activitats totals de qualificació en la primera ronda.
Activitats d'avaluació
Títol |
Pes |
Hores |
ECTS |
Resultats d'aprenentatge |
Assistència i participació activa a les classes |
5% |
0
|
0 |
1, 2, 4
|
Resolució d'un examen de síntesi final |
50% |
50
|
2 |
1, 2, 3, 4
|
Resolució dels exercicis de classe |
45% |
45
|
1,8 |
1, 2, 3, 4
|
Bibliografia
- G. Cowan; "Statistical Data Analysis", 1998, Oxford University Press
- P. A. Zyla et al. (Particle Data Group); "Review of Partcle Physcis (2021)", Prog. Theor. Exp. Phys. 2020, 083C01 (2020) and 2021 update
- F. James; "Statistical Methods in Experimental Physics", 2nd Edition, 2006, World Scientific
- L. Lyons, "Statistics for Particle and Nuclear Physicists", 1986, Cambridge University Press
- B. P. Roe, "Probability and Statistics in Experimental Physics", 1992, Springer
- A. G. Frodesen, et al., "Probability and statistics in particle physics", 1979, Columbia University Press D. Sivia and J. Skilling, "Data Analysis, A Bayesian Tutorial", 2nd ed., 2006, Oxford University Press A. Gelman, "Bayesian Data Analysis", 1995, CRC Press
- R. J. Barlow, "Statistics", 1989, J. Wiley
- W.T. Press et al., "Numerical Recipes: The Art of Scientific Computing", Cambridge University Press. E.T. Jaynes, "Probability Theory: The Logic of Science", Cambridge University Press.
- A. Stuart et al., "Kendall's Advanced Theory of Statistics", Vol 2A. Wiley.
- F. James, "Monte Carlo Theory and Practice", Rep. Prog. Phys. 43 (1980) 73.
Programari
Introduirem i farem ús de el llenguatge de programació Python (vegeu la secció "Prerequisits" per obtenir informació detallada sobre la instal·lació)
En particular, estudiarem i farem servir les següents llibreries Python: NumPy, pandas, matplotlib, SciPy i scikit learn