Logo UAB
2023/2024

Estadística i Anàlisi de Dades

Codi: 44079 Crèdits: 9
Titulació Tipus Curs Semestre
4313861 Física d'Altes Energies, Astrofísica i Cosmologia OB 0 1

Professor/a de contacte

Nom:
Francisco Javier Rico Castro
Correu electrònic:
franciscojavier.rico@uab.cat

Idiomes dels grups

Podeu accedir-hi des d'aquest enllaç. Per consultar l'idioma us caldrà introduir el CODI de l'assignatura. Tingueu en compte que la informació és provisional fins a 30 de novembre de 2023.

Equip docent

Abelardo Moralejo Olaizola
Carles Sánchez Alonso
Jorge Carretero Palacios
Pau Tallada Crespí
Martin Borstad Eriksen
Francesc d'Assis Torradeflot Curero

Prerequisits

Per al "Bootcamp" de Python (part 2), és necessari portar un ordinador portàtil personal amb una instal·lació en execució de Python 3.

Per a això, instal·leu Python 3 amb l'Anaconda intaller. D'aquesta manera, la vostra distribució de Python contindrà tots els paquets associats necessaris per a aquest curs.

Seguiu aquests passos:

1. Descarregueu el programa d’instal·lació d'Anaconda per a Python 3 https://www.anaconda.com/download/

2. Seguiu les instruccions d’instal·lació: les versions de la interfície d’interfície gràfica o de la terminal funcionen bé. Si se us demana, seleccioneu l'opció per afegir el directori anaconda nou a la vostra ruta.

Es recomana l’ús de GNU/Linux 


Objectius

En aquest curs aprendrem a destil·lar coneixements científics a partir de dades experimentals, un procés que es basa en mètodes estadístics. Aprendrem els conceptes bàsics de probabilitat i estadística (en els seus marcs freqüentistes i bayesians). A més, estudiarem i practicarem diversos mètodes estadístics i tècniques d’anàlisi de dades que s’utilitzen habitualment en els camps de la Física d’Altes Energies, Astrofísica i Cosmologia. Amb aquest objectiu, aprendrem i practicarem l’ús d’estadístiques modernes i eines de programari d’anàlisi.


Competències

  • Que els estudiants sàpiguen aplicar els coneixements adquirits i la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
  • Treballar en grup, assumir responsabilitats compartides i interaccionar professionalment i de manera constructiva amb altres persones amb un respecte absolut als seus drets.
  • Utilitzar les matemàtiques per descriure el món físic, seleccionar les equacions apropiades, construir models adequats, interpretar resultats matemàtics i comparar críticament amb experimentació i observació.
  • Utilitzar programari adequat, llenguatges de programació i paquets informàtics en la investigació de problemes relacionats amb la física d'altes energies, l'astrofísica o la cosmologia.

Resultats d'aprenentatge

  1. Aplicar les tècniques d'anàlisi de dades a problemes tant de l'àmbit de la física de partícules, l'astrofísica i la cosmologia com d'àmbits propers però diferents.
  2. Aprendre el funcionament de programes informàtics d'anàlisi estadística.
  3. Treballar en petits grups per resoldre problemes d'anàlisi de dades.
  4. Utilitzar les tècniques Monte Carlo per a modelar problemes reals de Física.

Continguts

Part 1: Conceptes bàsics sobre tècniques de probabilitat, estadística i Monte Carlo

Part 2: Python per a estadístiques i anàlisi de dades

Part 3: Estimació de paràmetres, prova d'hipòtesi i "Unfolding"

Part 4: Estadístique Bayesiane


Metodologia

  • Classes teòriques que inclouen exemples pràctics en els camps de la Física d'Altes Energies, Astrofísica i Cosmologia
  • Exercicis i tasques que hauran de resoldre els estudiants sols o en grups petits
  • Discussió de problemes durant les classes i tutories
  • Sessions presencials sobre eines de programari per a estadístiques i anàlisi de dades (en llenguatge de programació Python)
  • Explicació i discussió de codis de mostra / algorismes en llenguatges de programació de Python durant les classes i tutorials
 

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Clases 56 2,24 1, 2, 4
Estudi de la teoria i exemples pràctics 64 2,56 1, 2, 3, 4
Tipus: Autònomes      
Discussió, grups de treball, resolució de problemes 60 2,4 1, 2, 3, 4

Avaluació


  • Assistència i participació activa a les classes teòriques
  • Resolució d'exercicis específics al llarg del curs
  • Resolució d'un examen final
 
Per a aquelles i aquells estudiants que no superin el curs després del procediment regular d'avaluació, hi haurà una ronda d'avaluació de recuperació que consistirà en exercicis específics per a les diferents parts del curs i un examen final de síntesi. No hi haurà marca de llindar perquè pugui optar a la ronda d'avaluació de recuperació, llevat del requisit general d'haver estat avaluat/avaluada com a mínim en un 66% de les activitats totals de qualificació en la primera ronda.
 
Aquesta assignatura/mòdul no preveu el sistema d’avaluació única.
 

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Assistència i participació activa a les classes 5% 0 0 1, 2, 4
Resolució d'un examen de síntesi final 50% 5 0,2 1, 2, 4
Resolució dels exercicis de classe 45% 40 1,6 1, 2, 3, 4

Bibliografia

 

  • G. Bohm and G. Zech; "Introduction to Statistics and Data Analysis for Physicists", 3rd Edition, 2017, Verlag Deutsches Elektronen-Synchrotron (available on-line https://s3.cern.ch/inspire-prod-files-d/da9d786a06bf64d703e5c6665929ca01)
  • F. James; "Statistical Methods in Experimental Physics", 2nd Edition, 2006, World Scientific
  • G. Cowan; "Statistical Data Analysis", 1998, Oxford University Press
  • A. Gelman, J. B. Carlin, H. S. Stern, et al. "Bayesian Data Analysis", 3rd Edition, 2013, CRC Press

Programari

Introduirem i farem ús de el llenguatge de programació Python (vegeu la secció "Prerequisits" per obtenir informació detallada sobre la instal·lació)

En particular, estudiarem i farem servir les següents llibreries Python: NumPy, pandas, matplotlib, SciPy i scikit learn