Análisis de Datos Complejos
Código: 104399
Créditos ECTS: 6
2024/2025
| Titulación |
Tipo |
Curso |
| 2503740 Matemática Computacional y Analítica de Datos |
OB |
2 |
Idiomas de los grupos
Puede consultar esta información al final del documento.
Prerrequisitos
Se recomienda tener conocimientos de probabilidad e inferencia estadística así como una cierta soltura con el software R.
Objetivos y contextualización
El principal objetivo es proporcionar herramientas estadísticas para el análisis de datos, dominando las técnicas más relevantes para enfrentarse con modelos complejos.
Resultados de aprendizaje
- CM14 (Competencia) Implementar estrategias para confirmar o refutar hipótesis.
- CM15 (Competencia) Gestionar la información para su validación mediante un tratamiento estadístico.
- CM15 (Competencia) Gestionar la información para su validación mediante un tratamiento estadístico.
- CM16 (Competencia) Evaluar, a partir de datos obtenidos, desigualdades por razón de sexo/género.
- KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
- KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
- KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
- KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
- KM14 (Conocimiento) Identificar la utilidad de los métodos Bayesianos, aplicándolos oportunamente.
- KM14 (Conocimiento) Identificar la utilidad de los métodos Bayesianos, aplicándolos oportunamente.
- SM14 (Habilidad) Utilizar las propiedades de las funciones de densidad y de distribución.
- SM14 (Habilidad) Utilizar las propiedades de las funciones de densidad y de distribución.
- SM15 (Habilidad) Utilizar software estadístico apropiado para gestionar bases de datos, para obtener índices de resumen de las variables del estudio y para analizar los datos mediante técnicas de inferencia.
- SM15 (Habilidad) Utilizar software estadístico apropiado para gestionar bases de datos, para obtener índices de resumen de las variables del estudio y para analizar los datos mediante técnicas de inferencia.
- SM15 (Habilidad) Utilizar software estadístico apropiado para gestionar bases de datos, para obtener índices de resumen de las variables del estudio y para analizar los datos mediante técnicas de inferencia.
Contenido
Tema 1- Modelos lineales: regresión múltiple y ANOVA.
Tema 2- Modelos lineales generalizados: regresión logística y de Poisson.
Tema 3- Regularización: Modelos lasso y ridge.
Tema 4- Técnicas de Big Data en modelos lineales y modelos lineales generalizados.
Tema 5- Técnicas de remuestreo: Tests permutacionals y Bootstrap.
Actividades formativas y Metodología
| Título |
Horas |
ECTS |
Resultados de aprendizaje |
| Tipo: Dirigidas |
|
|
|
| Clases de Teoría |
24
|
0,96 |
|
| Clases de problemas |
20
|
0,8 |
|
| Tipo: Supervisadas |
|
|
|
| Sesiones prácticas |
20
|
0,8 |
|
| Tipo: Autónomas |
|
|
|
| Trabajo personal |
61
|
2,44 |
|
De acuerdo con los objetivos de la asignatura, el desarrollo del curso se basa en las siguientes actividades:
- Clases de teoría: El alumno adquiere los conocimientos científico-técnicos propios de la asignatura, asistiendo en las clases de teoría, complementándolas con el estudio personal de los temas explicados. Las clases de teoría son las actividades en las cuales se exige menos interactividad al estudiante: están concebidas como un método fundamentalmente unidireccional de transmisión de conocimientos del profesor al alumno. Las clases se harán utilizando un apoyo de diapositivas PowerPoint en Anglès que se colgarán también al Campus Virtual.
- Clases de problemas y prácticas: Los problemas y las prácticas son sesiones con una doble misión. Por un lado, se trabajan los conocimientos científico-técnicos expuestos en las clases de teoría para completar su comprensión y profundizar en ellos, desarrollando actividades diversas, desde la típica resolución de problemas hasta la discusión de casos prácticos. Por otro lado, las clases de problemas son el foro natural en el cual discutir en común el desarrollo del trabajo práctico, aportando los conocimientos necesarios para llevarlo adelante, o indicando donde y como se pueden adquirir.
El curso práctico de esta asignatura se plantea como un camino para orientar el estudiante en un trabajo de campo de estadística en cada una de sus etapas. Así realizan por su cuenta con el software R unos ejercicios prácticos dirigidos a resolver problemas reales concretos. Este planteamiento está orientado a promover un aprendizaje activo y a desarrollar el razonamiento crítico y la capacidad de análisis y síntesis.
Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.
Evaluación
Actividades de evaluación continuada
| Título |
Peso |
Horas |
ECTS |
Resultados de aprendizaje |
| Ejercicios |
30 |
20
|
0,8 |
CM14, CM15, CM16, KM12, KM14, SM14, SM15
|
| Examen parcial 1 |
35 |
2,5
|
0,1 |
CM15, KM12, SM14
|
| Examen parcial 2 |
35 |
2,5
|
0,1 |
CM15, KM12, SM14
|
La evaluación se realiza a lo largo de todo el curso. La evaluación continuada tiene varios objetivos fundamentales: Monitorizar el proceso de enseñanza y aprendizaje, permitiendo tanto al alumno como al profesor conocer el grado de logro de las competencias y corregir, si es posible, las desviaciones que se produzcan. Incentivar el esfuerzo continuado del alumno frente al sobreesfuerzo, frecuentemente inútil, de última hora. Verificar que el alumno ha logrado las competencias determinadas en el plan de estudios.
Para hacer esta evaluación se cuenta con los siguientes instrumentos: Los ejercicios prácticos librados por los estudiantes (30%), un examen parcial de Teoría en medio del curso (35%), otro examen parcial de Teoría al final del curso (35%). A la recuperación solo podrán ir los alumnos que tengan un mínimo de 3 en la nota final, recuperando solo la parte de Teoría.
El alumnado que se haya acogido a la modalidad de evaluación única deberá realizar una prueba final que consistirá en un examen en el que podrá haber cuestiones de teoría y resolución de problemas, y un examen de prácticas delante del ordenador. Esta prueba se realizará el mismo día, hora y lugar en que se realice la prueba del segundo parcial. Quien no se presente a dicha prueba sin causa justificada, obtendrá la calificación de NO EVALUABLE. Si se obtiene una nota inferior a 5, podrá recuperarse el mismo día, hora y lugar que se realice la recuperación del resto de alumnos del curso.
Bibliografía
- Introduction to Linear Regression Analysis. Montgomery, D. Peck, A. Vining, G., 2001.
- An R Companion to Linear Statistical Models. Christopher Hay-Jahans, 2012.
- Generalized Linear Models. McCullagh, P. and Nelder, J., 1992.
- The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Hastie T., Tibshirani, R., Friedman, J. 2009.
- Resampling methods: a practical guide to data Analysis. Phillip I. Good, 2006.
- The jackknife, the bootstrap and other resampling plans. Bradley Efron, 1982.
- Bootstrap methods and their application. A.C. Davison, D.V. Hinkley, 1997.
Software
Se utilizará el software R.
Lista de idiomas
| Nombre |
Grupo |
Idioma |
Semestre |
Turno |
| (PLAB) Prácticas de laboratorio |
1 |
Catalán/Español |
segundo cuatrimestre |
manaña-mixto |
| (SEM) Seminarios |
1 |
Catalán/Español |
segundo cuatrimestre |
manaña-mixto |
| (TE) Teoría |
1 |
Catalán/Español |
segundo cuatrimestre |
manaña-mixto |