2021/2022
Estadística y Análisis de Datos
Código: 44079
Créditos ECTS: 9
Titulación |
Tipo |
Curso |
Semestre |
4313861 Física de Altas Energias, Astrofísica y Cosmología/High Energy Physics, Astrophysics and Cosmology |
OB |
0 |
1 |
La metodología docente y la evaluación propuestas en la guía pueden experimentar alguna modificación en función de las restricciones a la presencialidad que impongan las autoridades sanitarias.
Uso de idiomas
- Lengua vehicular mayoritaria:
- inglés (eng)
Equipo docente
- Ramon Miquel Pascual
- Abelardo Moralejo Olaizola
- Jorge Carretero Palacios
- Pau Tallada Crespí
- Francesc d'Assis Torradeflot Curero
Prerequisitos
Para el "Bootcamp" de Python (parte 2), es muy recomendable traer un ordenador portátil personal con una instalación de Python 3.8.
Se recomienda instalar Python 3.8 con el intalador de Anaconda. De esta manera, su distribución de Python contendrá todos los paquetes asociados necesarios para este curso.
Siga estos pasos:
1. Descargue el instalador de Anaconda para Python 3.8 aquí https://www.anaconda.com/download/
2. Siga las instrucciones de instalación; tanto la GUI como las versiones de terminal funcionan bien. Si se le solicita, seleccione la opción para agregar el nuevo directorio de anaconda a su ruta.
El uso de Linux o Mac es altamente recomendado.
Objetivos y contextualización
En este curso aprenderemos cómo extraer conocimiento científico de datos experimentales, un proceso que se basa en métodos estadísticos. Aprenderemos los conceptos básicos de Probabilidad y Estadística (en sus marcos Frequentista y Bayesiano). Además, estudiaremos y practicaremos varios métodos estadísticos particulares y técnicas de análisis de datos que normalmente se utilizan en los campos de Física de Alta Energía, Astrofísica y Cosmología. Con ese fin, aprenderemos y practicaremos el uso de herramientas modernas de software de análisis y estadísticas.
Competencias
- Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
- Trabajar en grupo, asumir responsabilidades compartidas e interaccionar profesionalmente y de manera constructiva con otras personas con un respeto absoluto a sus derechos.
- Usar las matemáticas para describir el mundo físico, seleccionar las ecuaciones apropiadas, construir modelos adecuados, interpretar resultados matemáticos y comparar críticamente con experimentación y observación.
- Usar software adecuado, lenguajes de programación y paquetes informáticos en la investigación de problemas relacionados con la física de altas energías, la astrofísica o la cosmología.
Resultados de aprendizaje
- Aplicar las técnicas de análisis de datos a problemas tanto del ámbito de la física de partículas, la astrofísica y la cosmología, como de ámbitos cercanos pero distintos.
- Aprender el funcionamiento de programas informáticos de análisis estadístico.
- Trabajar en pequeños grupos para resolver problemas de análisis de datos
- Utilizar las técnicas Monte Carlo para modelar problemas reales de Física.
Contenido
Parte 1: Conceptos básicos sobre probabilidad, estadística y técnicas de Monte Carlo.
Parte 2: Python para estadísticas y análisis de datos
Parte 3: Estimación de parámetros, test de hipótesis y "Unfolding".
Parte 4: Estadística Bayesiana
Metodología
- Conferencias teóricas que incluyen ejemplos prácticos en los campos de Física de Alta Energía, Astrofísica y Cosmología.
- Ejercicios y tareas para ser resueltos por estudiantes solos o en grupos pequeños.
- Discusión de problemas durante las clases y tutorías.
- Sesiones prácticas sobre herramientas de software para estadísticas y análisis de datos (en lenguaje de programación Python)
- Explicación y discusión de código / algoritmos de muestra en lenguajes de programación Python durante clases y tutoriales
Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.
Evaluación
La evaluación tendrá en cuenta:
- Asistencia y participación activa a las clases.
- Resolución, para cada una de las partes del curso, de ejercicios específicos para llevar a casa.
- Resolución de un examen final de síntesis para llevar a casa.
Para aquellos estudiantes que no aprueben el curso después del procedimiento de evaluación regular, habrá una ronda de evaluación de recuperación que consiste también en ejercicios específicos para llevar a casa para las diferentes partes del curso, además de un examen final de síntesis. No habrá una nota de umbral para ser elegible para la ronda de evaluación de recuperación, aparte del requisito general de haber sido evaluado al menos para un 66% del total de actividades de calificación en la primera ronda.
Actividades de evaluación
Título |
Peso |
Horas |
ECTS |
Resultados de aprendizaje |
Asistencia y participación activa en las clases. |
5% |
0
|
0 |
1, 2, 4
|
Resolución de ejercicios de clase |
45% |
45
|
1,8 |
1, 2, 3, 4
|
Resolución de un examen final de síntesis |
50% |
50
|
2 |
1, 2, 3, 4
|
Bibliografía
- G. Cowan; "Statistical Data Analysis", 1998, Oxford University Press
- P. A. Zyla et al. (Particle Data Group); "Review of Partcle Physcis (2021)", Prog. Theor. Exp. Phys. 2020, 083C01 (2020) and 2021 update
- F. James; "Statistical Methods in Experimental Physics", 2nd Edition, 2006, World Scientific
- L. Lyons, "Statistics for Particle and Nuclear Physicists", 1986, Cambridge University Press
- B. P. Roe, "Probability and Statistics in Experimental Physics", 1992, Springer
- A. G. Frodesen, et al., "Probability and statistics in particle physics", 1979, Columbia University Press D. Sivia and J. Skilling, "Data Analysis, A Bayesian Tutorial", 2nd ed., 2006, Oxford University Press A. Gelman, "Bayesian Data Analysis", 1995, CRC Press
- R. J. Barlow, "Statistics", 1989, J. Wiley
- W.T. Press et al., "Numerical Recipes: The Art of Scientific Computing", Cambridge University Press. E.T. Jaynes, "Probability Theory: The Logic of Science", Cambridge University Press.
- A. Stuart et al., "Kendall's Advanced Theory of Statistics", Vol 2A. Wiley.
- F. James, "Monte Carlo Theory and Practice", Rep. Prog. Phys. 43 (1980) 73.
Software
Introduciremos y haremos uso del lenguaje de programación Python (consulte la sección "Prerequisitos" para obtener información detallada sobre la instalación)
En particular, estudiaremos y utilizaremos las siguientes librerías Python: NumPy, pandas, matplotlib, scipy y scikit learn