Logo UAB

Análisis de Datos Transversales

Código: 104878 Créditos ECTS: 6
2024/2025
Titulación Tipo Curso
2503852 Estadística Aplicada OT 4

Contacto

Nombre:
Jose Barrera Gomez
Correo electrónico:
jose.barrera@uab.cat

Idiomas de los grupos

Puede consultar esta información al final del documento.


Prerrequisitos

Se asume que el alumnado que asista a esta asignatura ha cursado previamente la asignatura "Estadística en Ciencias de la Salud".


Objetivos y contextualización

Los objetivos principales del curso son:

- Conocer las principales características de un estudio epidemiológico transversal.

- Aprender a diseñar un cuestionario de salud.

- Aprender a crear, limpiar y validar un conjunto de datos a partir de la información contenida en un cuestionario de salud.

- Aprender a modelar la asociación entre un indicador de salud y una exposición potencialmente relacionada, en presencia de posibles problemas de confusión.

- Aprender a modelar prevalencias y tasas mediante modelos lineales generalizados en una única población o en diferentes subpoblaciones.

- Utilizar R para gestionar y modelar datos transversales.

- Ser capaz de escribir informes estadísticos reproductibles mediante LaTeX y el paquete knitr de R.


Resultados de aprendizaje

  1. CM14 (Competencia) Proponer el modelo estadístico necesario para analizar conjuntos de datos pertenecientes a estudios reales.
  2. KM17 (Conocimiento) Reconocer los modelos estadísticos para el análisis de datos con distintas estructuras y complejidad que aparecen frecuentemente en distintos ámbitos de aplicación.
  3. KM18 (Conocimiento) Reconocer el lenguaje propio de las aplicaciones de economía y finanzas, ciencias biomédicas e ingeniería, aportado por la investigación y la innovación en el ámbito de la estadística.
  4. KM18 (Conocimiento) Reconocer el lenguaje propio de las aplicaciones de economía y finanzas, ciencias biomédicas e ingeniería, aportado por la investigación y la innovación en el ámbito de la estadística.
  5. SM16 (Habilidad) Seleccionar las fuentes de información adecuadas para el trabajo estadístico
  6. SM17 (Habilidad) Debatir artículos científicos en que se plantee el análisis de un estudio propio de las diferentes áreas de aplicación.
  7. SM18 (Habilidad) Depurar la información disponible para su posterior tratamiento estadístico.
  8. SM19 (Habilidad) Analizar datos de estructuras complejas, ya sea por su naturaleza o por su dimensión.

Contenido

(*)

1. Introducción a los contenidos. Introducción a la investigación reproducible utilizando el paquete knitr de R.

2. Datos transversales.

(a) Datos de corte transversal.

(b) Fuentes de información: información reportada, información medida.

(c) Aspectos a considerar durante el diseño de una encuesta de salud.

(d) El libro de códigos

3. Estudios basados en la población: estudios transversales.

(a) Características

(b) Ventajas

(c) Desventajas

(d) Comparación con otros diseños de estudios epidemiológicos.

4. La medición de la presencia de la enfermedad en estudios transversales: la prevalencia

5. Exposición binaria y enfermedad: la tabla de contingencia 2 x 2.

(a) Pruebas de independencia entre exposición y enfermedad: aproximación asintótica: prueba de chi-cuadrado, prueba de Fisher: inconvenientes, diseño e implementación de una prueba exacta bajo diseño de sección transversal

6. Revisión del GLM

(a) Especificación del modelo

(b) Estimación de máxima verosimilitud de los parámetros del modelo.

(c) Pruebas de hipótesis para los parámetros del modelo: prueba de Wald y prueba de razón de verosimilitudes.

(d) Interpretación de los parámetros del modelo.

(e) Tratar con confusoras

(f) Considerando interacciones

(g) Selección de modelos. Significación, bondad de ajuste, sensibilidad, especificidad, ROC.

7. Modelado de prevalencias con el GLM

(a) Modelado de OR con la regresión logística

(b) Modelado de PR con la regresión log-binomial

(c) Modelado de PD con la regresión lineal

(d) Bondad de ajuste

8. Modelado de conteos y tasas con el GLM

(a) Regresión de Poisson

(b) Regresión binomial-negativa

(c) Modelos para exceso de ceros

9. Introducción a los modelos de regresión para respuesta politómica.

10. El Modelo lineal generalizado mixto para modelar prevalencias y tasas en datos agrupados.

*A menos que las restricciones impuestas por las autoridades sanitarias obliguen a una priorización o reducción de estos contenidos.


Actividades formativas y Metodología

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Sesiones de teoría 14 0,56
Tipo: Supervisadas      
Sesiones de prácticas 28 1,12
Tipo: Autónomas      
Trabajo personal 108 4,32

(*)

- Sesiones teóricas: en estas sesiones, se presentan los diferentes conceptos del tema, así como ejemplos ilustrativos. Además, se propone resolver algunos ejercicios (que generalmente requieren el uso de R). La metodología se basa en la presentación y discusión de diapositivas, así como en la presentación de algunos materiales adicionales (principalmente noticias publicadas en medios en línea y artículos científicos buscados en PubMed).

- Sesiones prácticas: En estas sesiones, se propondrán varios ejemplos prácticos y ejercicios. Se desarrollarán actividades relacionadas con el uso de R, búsqueda en PubMed, lectura de artículos y análisis estadísticos. Algunos de los ejercicios propuestos serán de entrega obligatoria.

- Asistencia a seminarios: el Departamento de Matemáticas y el Servicio de Estadística de la UAB organizan seminarios de estadística. Los alumnos y el profesor asistirían a algunos de ellos, según el tema y el horario.

*La metodología docente propuesta puede experimentar alguna modificación en función de las restricciones a la presencialidad que impongan las autoridades sanitarias.

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.


Evaluación

Actividades de evaluación continuada

Título Peso Horas ECTS Resultados de aprendizaje
Ejercicios en grupo 20% 0 0 CM14, KM17, KM18, SM16, SM17, SM18, SM19
Examen (o examen compensatorio) 50% 0 0 CM14, KM17, KM18, SM16, SM17, SM18, SM19
Trabajos en grupo 30% 0 0 CM14, KM17, KM18, SM16, SM17, SM18, SM19

(*)

- Trabajos en grupo durante el curso. El profesor podrá evaluar la contribución personal mediante preguntas orales individuales.

- Examen presencial.

- Examen compensatorio opcional presencial. Si el estudiante asiste al examen compensatorio, su calificación sustituirá la puntuación en el examen ordinario anterior, independientemente de la puntuación obtenida en ambos exámenes.

- Esta asignatura no ofrece la posibilidad de evaluación única.

*La evaluación propuesta puede experimentar alguna modificación en función de las restricciones a la presencialidad que impongan las autoridades sanitarias.


Bibliografía

Básica: todos los conceptos desarrollados en las sesiones de clase se publicarán en Moodle, incluidas las diapositivas que se tratarán en las sesiones de teoría.

Otras lecturas: los estudiantes interesados en ir más lejos pueden explorar los siguientes escritos:

- Agresti, Alan. Categorical Data Analysis. Wiley, 3rd Edition, 2013.

- Breslow, N., N. Day. Statistical methods in cancer research. International Agency for Research on Cancer, 1980.

- Christensen, R. Log-Linear Models and Logistic Regression. Springer, 2nd Edition, 1990.

- Clayton D., Hills, M. Statistical models in epidemiology. Oxford University Press, 1993.

- Dalgaard, P. Introductory Statistics with R. Springer, 3rd Edition, 2002.

- dos Santos, I. Cancer epidemiology: principles and methods. International Agency for Research on Cancer, 1999.

- Gordis, L. Epidemiology. W.B. Saunders, 2004.

- Hosmer, D.W., Lemeshow, S. Applied Logistic Regression. Wiley, 2nd Edition, 2000.

- Kleinbaum, D.G. y Klein, M. Logistic Regression. A Self-Learning Text. Springer, 2002.

- Lachin, J.M. Biostatistical Methods: The Assessment of Relative Risks. Wiley, 2000.

- Motulsky, H.J. Intuitive Biostatistics. Oxford University Press, 1995.

- McCullagh, P., Nelder, J.A. Generalized Linear Models. Chapman and Hall, 1983.

- Rothman, K., Greenland, S. Modern epidemiology. Lippincott Williams & Wilkins, 1998.

- Rothman, K. Epidemiology: an introduction. Oxford University Press, 2002.

- Wassertheil-Smoller, S. Biostatistics and epidemiology: a primer for health and biomedical prefessionals. Springer, 3rd Edition, 2004


Software

  • R
  • RStudio
  • LaTeX

Lista de idiomas

Nombre Grupo Idioma Semestre Turno
(PLAB) Prácticas de laboratorio 1 Catalán/Español primer cuatrimestre manaña-mixto
(TE) Teoría 1 Catalán/Español primer cuatrimestre manaña-mixto