Logo UAB

Análisis de Datos Complejos

Código: 104399 Créditos ECTS: 6
2024/2025
Titulación Tipo Curso
2503740 Matemática Computacional y Analítica de Datos OB 2

Contacto

Nombre:
Amanda Fernandez Fontelo
Correo electrónico:
amanda.fernandez@uab.cat

Idiomas de los grupos

Puede consultar esta información al final del documento.


Prerrequisitos

Se recomienda tener conocimientos de probabilidad e inferencia estadística así como una cierta soltura con el software R.


Objetivos y contextualización

El principal objetivo es proporcionar herramientas estadísticas para el análisis de datos, dominando las técnicas más relevantes para enfrentarse con modelos complejos.


Resultados de aprendizaje

  1. CM14 (Competencia) Implementar estrategias para confirmar o refutar hipótesis.
  2. CM15 (Competencia) Gestionar la información para su validación mediante un tratamiento estadístico.
  3. CM15 (Competencia) Gestionar la información para su validación mediante un tratamiento estadístico.
  4. CM16 (Competencia) Evaluar, a partir de datos obtenidos, desigualdades por razón de sexo/género.
  5. KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
  6. KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
  7. KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
  8. KM12 (Conocimiento) Identificar la inferencia estadística como instrumento de pronóstico y predicción.
  9. KM14 (Conocimiento) Identificar la utilidad de los métodos Bayesianos, aplicándolos oportunamente.
  10. KM14 (Conocimiento) Identificar la utilidad de los métodos Bayesianos, aplicándolos oportunamente.
  11. SM14 (Habilidad) Utilizar las propiedades de las funciones de densidad y de distribución.
  12. SM14 (Habilidad) Utilizar las propiedades de las funciones de densidad y de distribución.
  13. SM15 (Habilidad) Utilizar software estadístico apropiado para gestionar bases de datos, para obtener índices de resumen de las variables del estudio y para analizar los datos mediante técnicas de inferencia.
  14. SM15 (Habilidad) Utilizar software estadístico apropiado para gestionar bases de datos, para obtener índices de resumen de las variables del estudio y para analizar los datos mediante técnicas de inferencia.
  15. SM15 (Habilidad) Utilizar software estadístico apropiado para gestionar bases de datos, para obtener índices de resumen de las variables del estudio y para analizar los datos mediante técnicas de inferencia.

Contenido

Tema 1- Modelos lineales: regresión múltiple y ANOVA.
Tema 2- Modelos lineales generalizados: regresión logística y de Poisson.
Tema 3- Regularización: Modelos lasso y ridge.
Tema 4- Técnicas de Big Data en modelos lineales y modelos lineales generalizados.
Tema 5- Técnicas de remuestreo: Tests permutacionals y Bootstrap.

 


Actividades formativas y Metodología

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clases de Teoría 24 0,96
Clases de problemas 20 0,8
Tipo: Supervisadas      
Sesiones prácticas 20 0,8
Tipo: Autónomas      
Trabajo personal 61 2,44

De acuerdo con los objetivos de la asignatura, el desarrollo del curso se basa en las siguientes actividades:

  • Clases de teoría: El alumno adquiere los conocimientos científico-técnicos propios de la asignatura, asistiendo en las clases de teoría, complementándolas con el estudio personal de los temas explicados. Las clases de teoría son las actividades en las cuales se exige menos interactividad al estudiante: están concebidas como un método fundamentalmente unidireccional de transmisión de conocimientos del profesor al alumno. Las clases se harán utilizando un apoyo de diapositivas PowerPoint en Anglès que se colgarán también al Campus Virtual.
  • Clases de problemas y prácticas: Los problemas y las prácticas son sesiones con una doble misión. Por un lado, se trabajan los conocimientos científico-técnicos expuestos en las clases de teoría para completar su comprensión y profundizar en ellos, desarrollando actividades diversas, desde la típica resolución de problemas hasta la discusión de casos prácticos. Por otro lado, las clases de problemas son el foro natural en el cual discutir en común el desarrollo del trabajo práctico, aportando los conocimientos necesarios para llevarlo adelante, o indicando donde y como se pueden adquirir.

El curso práctico de esta asignatura se plantea como un camino para orientar el estudiante en un trabajo de campo de estadística en cada una de sus etapas. Así realizan por su cuenta con el software R unos ejercicios prácticos dirigidos a resolver problemas reales concretos. Este planteamiento está orientado a promover un aprendizaje activo y a desarrollar el razonamiento crítico y la capacidad de análisis y síntesis.

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.


Evaluación

Actividades de evaluación continuada

Título Peso Horas ECTS Resultados de aprendizaje
Ejercicios 30 20 0,8 CM14, CM15, CM16, KM12, KM14, SM14, SM15
Examen parcial 1 35 2,5 0,1 CM15, KM12, SM14
Examen parcial 2 35 2,5 0,1 CM15, KM12, SM14

La evaluación se realiza a lo largo de todo el curso. La evaluación continuada tiene varios objetivos fundamentales: Monitorizar el proceso de enseñanza y aprendizaje, permitiendo tanto al alumno como al profesor conocer el grado de logro de las competencias y corregir, si es posible, las desviaciones que se produzcan. Incentivar el esfuerzo continuado del alumno frente al sobreesfuerzo, frecuentemente inútil, de última hora. Verificar que el alumno ha logrado las competencias determinadas en el plan de estudios.

Para hacer esta evaluación se cuenta con los siguientes instrumentos: Los ejercicios prácticos librados por los estudiantes (30%), un examen parcial de Teoría en medio del curso (35%), otro examen parcial de Teoría al final del curso (35%). A la recuperación solo podrán ir los alumnos que tengan un mínimo de 3 en la nota final, recuperando solo la parte de Teoría.

El alumnado que se haya acogido a la modalidad de evaluación única deberá realizar una prueba final que consistirá en un examen en el que podrá haber cuestiones de teoría y resolución de problemas, y un examen de prácticas delante del ordenador. Esta prueba se realizará el mismo día, hora y lugar en que se realice la prueba del segundo parcial. Quien no se presente a dicha prueba sin causa justificada, obtendrá la calificación de NO EVALUABLE. Si se obtiene una nota inferior a 5, podrá recuperarse el mismo día, hora y lugar que se realice la recuperación del resto de alumnos del curso.

 


Bibliografía

  • Introduction to Linear Regression Analysis. Montgomery, D. Peck, A. Vining, G., 2001.
  • An R Companion to Linear Statistical Models. Christopher Hay-Jahans, 2012.
  • Generalized Linear Models. McCullagh, P. and Nelder, J., 1992.
  • The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Hastie T., Tibshirani, R., Friedman, J. 2009. 
  • Resampling methods: a practical guide to data Analysis. Phillip I. Good, 2006.
  • The jackknife, the bootstrap and other resampling plans. Bradley Efron, 1982.
  • Bootstrap methods and their application. A.C. Davison, D.V. Hinkley, 1997.

 


Software

Se utilizará el software R.


Lista de idiomas

Nombre Grupo Idioma Semestre Turno
(PLAB) Prácticas de laboratorio 1 Catalán/Español segundo cuatrimestre manaña-mixto
(SEM) Seminarios 1 Catalán/Español segundo cuatrimestre manaña-mixto
(TE) Teoría 1 Catalán/Español segundo cuatrimestre manaña-mixto