Logo UAB
2022/2023

Estadística y Análisis de Datos

Código: 44079 Créditos ECTS: 9
Titulación Tipo Curso Semestre
4313861 Física de Altas Energias, Astrofísica y Cosmología/High Energy Physics, Astrophysics and Cosmology OB 0 1

Contacto

Nombre:
Francisco Javier Rico Castro
Correo electrónico:
franciscojavier.rico@uab.cat

Uso de idiomas

Lengua vehicular mayoritaria:
inglés (eng)

Equipo docente

Ramon Miquel Pascual
Abelardo Moralejo Olaizola
Jorge Carretero Palacios
Pau Tallada Crespí
Martin Borstad Eriksen
Francesc d'Assis Torradeflot Curero

Prerequisitos

Para el "Bootcamp" de Python (parte 2), es muy recomendable traer un ordenador portátil personal con una instalación de Python 3.9.

Se recomienda instalar Python 3.9 con el intalador de Anaconda. De esta manera, su distribución de Python contendrá todos los paquetes asociados necesarios para este curso.

Siga estos pasos:

1. Descargue el instalador de Anaconda para Python 3.9 aquí https://www.anaconda.com/download/

2. Siga las instrucciones de instalación; tanto la GUI como las versiones de terminal funcionan bien. Si se le solicita, seleccione la opción para agregar el nuevo directorio de anaconda a su ruta.

El uso de Linux o Mac es altamente recomendado.

Objetivos y contextualización

En este curso aprenderemos cómo extraer conocimiento científico de datos experimentales, un proceso que se basa en métodos estadísticos. Aprenderemos los conceptos básicos de Probabilidad y Estadística (en sus marcos Frequentista y Bayesiano). Además, estudiaremos y practicaremos varios métodos estadísticos particulares y técnicas de análisis de datos que normalmente se utilizan en los campos de Física de Alta Energía, Astrofísica y Cosmología. Con ese fin, aprenderemos y practicaremos el uso de herramientas modernas de software de análisis y estadísticas.

Competencias

  • Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • Trabajar en grupo, asumir responsabilidades compartidas e interaccionar profesionalmente y de manera constructiva con otras personas con un respeto absoluto a sus derechos.
  • Usar las matemáticas para describir el mundo físico, seleccionar las ecuaciones apropiadas, construir modelos adecuados, interpretar resultados matemáticos y comparar críticamente con experimentación y observación.
  • Usar software adecuado, lenguajes de programación y paquetes informáticos en la investigación de problemas relacionados con la física de altas energías, la astrofísica o la cosmología.

Resultados de aprendizaje

  1. Aplicar las técnicas de análisis de datos a problemas tanto del ámbito de la física de partículas, la astrofísica y la cosmología, como de ámbitos cercanos pero distintos.
  2. Aprender el funcionamiento de programas informáticos de análisis estadístico.
  3. Trabajar en pequeños grupos para resolver problemas de análisis de datos
  4. Utilizar las técnicas Monte Carlo para modelar problemas reales de Física.

Contenido

Parte 1: Conceptos básicos sobre probabilidad, estadística y técnicas de Monte Carlo.

Parte 2: Python para estadísticas y análisis de datos

Parte 3: Estimación de parámetros, test de hipótesis y "Unfolding".

Parte 4: Estadística Bayesiana

Metodología

  • Conferencias teóricas que incluyen ejemplos prácticos en los campos de Física de Alta Energía, Astrofísica y Cosmología.
  • Ejercicios y tareas para ser resueltos por estudiantes solos o en grupos pequeños.
  • Discusión de problemas durante las clases y tutorías.
  • Sesiones prácticas sobre herramientas de software para estadísticas y análisis de datos (en lenguaje de programación Python)
  • Explicación y discusión de código / algoritmos de muestra en lenguajes de programación Python durante clases y tutoriales

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.

Actividades

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clases 56 2,24 1, 2, 4
Estudio de la teoría y ejemplos prácticos 40 1,6 1, 2, 3, 4
Tipo: Autónomas      
Discusión, grupos de trabajo, resolución de problemas. 34 1,36 1, 2, 3, 4

Evaluación

La evaluación tendrá en cuenta:

  • Asistencia y participación activa a las clases.
  • Resolución, para cada una de las partes del curso, de ejercicios específicos para llevar a casa.
  • Resolución de un examen final de síntesis para llevar a casa.

Para aquellos estudiantes que no aprueben el curso después del procedimiento de evaluación regular, habrá una ronda de evaluación de recuperación que consiste también en ejercicios específicos para llevar a casa para las diferentes partes del curso, además de un examen final de síntesis. No habrá una nota de umbral para ser elegible para la ronda de evaluación de recuperación, aparte del requisito general de haber sido evaluado al menos para un 66% del total de actividades de calificación en la primera ronda.

Actividades de evaluación

Título Peso Horas ECTS Resultados de aprendizaje
Asistencia y participación activa en las clases. 5% 0 0 1, 2, 4
Resolución de ejercicios de clase 45% 45 1,8 1, 2, 3, 4
Resolución de un examen final de síntesis 50% 50 2 1, 2, 3, 4

Bibliografía

  • G. Cowan; "Statistical Data Analysis", 1998, Oxford University Press
  • P. A. Zyla et al. (Particle Data Group); "Review of Partcle Physcis (2021)", Prog. Theor. Exp. Phys. 2020, 083C01 (2020) and 2021 update
  • F. James; "Statistical Methods in Experimental Physics", 2nd Edition, 2006, World Scientific
  • L. Lyons, "Statistics for Particle and Nuclear Physicists", 1986, Cambridge University Press
  • B. P. Roe, "Probability and Statistics in Experimental Physics", 1992, Springer
  • A. G. Frodesen, et al., "Probability and statistics in particle physics", 1979, Columbia University Press D. Sivia and J. Skilling, "Data Analysis, A Bayesian Tutorial", 2nd ed., 2006, Oxford University Press A. Gelman, "Bayesian Data Analysis", 1995, CRC Press
  • R. J. Barlow, "Statistics", 1989, J. Wiley
  • W.T. Press et al., "Numerical Recipes: The Art of Scientific Computing", Cambridge University Press. E.T. Jaynes, "Probability Theory: The Logic of Science", Cambridge University Press.
  • A. Stuart et al., "Kendall's Advanced Theory of Statistics", Vol 2A. Wiley.
  • F. James, "Monte Carlo Theory and Practice", Rep. Prog. Phys. 43 (1980) 73.

Software

Introduciremos y haremos uso del lenguaje de programación Python (consulte la sección "Prerequisitos" para obtener información detallada sobre la instalación)

En particular, estudiaremos y utilizaremos las siguientes librerías Python: NumPy, pandas, matplotlib, scipy y scikit learn