Logo UAB
2023/2024

Modelización e Inferencia

Código: 104392 Créditos ECTS: 6
Titulación Tipo Curso Semestre
2503740 Matemática Computacional y Analítica de Datos OB 2 1

Contacto

Nombre:
Rosario Delgado de la Torre
Correo electrónico:
rosario.delgado@uab.cat

Idiomas de los grupos

Puede consutarlo a través de este enlace. Para consultar el idioma necesitará introducir el CÓDIGO de la asignatura. Tenga en cuenta que la información es provisional hasta el 30 de noviembre del 2023.


Prerrequisitos

Se considera muy importante un buen conocimiento de los contenidos de las asignaturas cursadas durante el primer curso, especialmente las de probabilidad y cálculo.


Objetivos y contextualización

Esta asignatura es la primera del Grado dedicada a la Inferencia Estadística, que es la parte de la Estadística que permite obtener, de manera controlada, información sobre una población a partir de los datos de una muestra "representativa". La asignatura tiene un carácter central dentro de los estudios, ya que se presentan conceptos y técnicas que serán utilizados en muchas de las materias que se cursarán a partir de ahora. Concretamente, se empezará haciendo una introducción a la Estadística, y luego se tratará la estimación de parámetros, tanto puntual como por intervalos de confianza, así como los tests de hipótesis paramétricos clásicos para una y dos poblaciones normales y dicotómicas, y contrastes de independencia. Finalmente, se introducirá el modelo de regresión lineal simple.

La presencialidad de la docencia y de las actividades evaluables se adaptará siguiendo las recomendaciones de las autoridades sanitarias, a fin de garantizar la seguridad de todas las personas.


Competencias

  • Calcular y reproducir determinadas rutinas y procesos matemáticos con agilidad.
  • Evaluar de manera crítica y con criterios de calidad el trabajo realizado.
  • Formular hipótesis e imaginar estrategias para confirmarlas o refutarlas.
  • Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • Relacionar objetos matemáticos nuevos con otros conocidos y deducir sus propiedades.
  • Utilizar aplicaciones informáticas de análisis estadístico, cálculo numérico y simbólico, visualización gráfica, optimización u otras para experimentar y resolver problemas.

Resultados de aprendizaje

  1. Analizar datos mediante técnicas de inferencia para una o dos muestras.
  2. Conocer los diferentes métodos de recogida de datos.
  3. Describir las propiedades básicas de los estimadores puntuales y por intervalo.
  4. Escoger el software estadístico apropiado para analizar los datos mediante técnicas de inferencia.
  5. Evaluar de manera crítica y con criterios de calidad el trabajo realizado.
  6. Identificar distribuciones estadísticas.
  7. Identificar la inferencia estadística como instrumento de pronóstico y predicción.
  8. Interpretar los resultados obtenidos y concluir respecto a la hipótesis experimental.
  9. Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  10. Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  11. Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  12. Reconocer la utilidad de los métodos bayesianos y aplicarlos oportunamente.
  13. Utilizar las propiedades de las funciones de densidad.
  14. Utilizar las propiedades de las funciones de distribución.
  15. Utilizar software estadístico para gestionar bases de datos.
  16. Utilizar software estadístico para obtener índices de resumen de las variables del estudio.
  17. Validar y gestionar la información para su tratamiento estadístico.

Contenido

Preliminares de Probabilidad (recordatorio): Probabilidad y variables aleatorias. Concepto de ley. Distribuciones

discretas. Función de densidad y de probabilidad. Esperanza y varianza. Función generatriz de momentos. Ejemplos.

Tema 1. Introducción a la Estadística.

1. Estadística descriptiva y estadística inferencial.

1.1. Conceptos básicos en inferencia: población estadística y muestra; parámetros, estadísticos y estimadores.

1.2. Modelos estadísticos: paramétricos y no paramétricos.

2. Estadísticos más usuales: los momentos muestrales. Los estadísticos de orden.

3. Distribución de algunos estadísticos.

3.1. De una muestra de una población Normal: Teorema de Fisher.

3.2. El Teorema Central del Límite: normalidad asintótica de los momentos muestrales y de la proporción.

Tema 2: Estimación puntual.

1. Estimadores puntuales: definición y "buenas" propiedades.

1.1. Sesgo.

1.2. Comparación de estimadores sin sesgo. Eficiencia relativa.

1.3. Comparación de estimadores con sesgo: el error cuadrático medio.

1.4. Consistencia de un estimador.

2. Métodos para obtener estimadores.

2.1. Método de los momentos.

2.2. Método de la máxima verosimilitud (EMV).

2.2.1. Invarianza de los EMV.

2.2.2. Función Score e información deFisher.

2.2.3. Cota de Crámer-Rao.

2.2.4. Propiedades de los EMV.

2.2.5. Método Delta.

2.2.6. Procedimientos numéricos para determinar los EMV.

Tema 3. Estimación por intervalos de confianza.

1. Concepto de región e intervalo de confianza.

2. El método del "pivote" para la construcción de intervalos de confianza.

3. Intervalos de confianza para los parámetros de una población.

3.1. Para la media de una población Normal con desviación conocida y desconocida.

3.2. Para la varianza de una población Normal con media conocida y desconocida.

3.3. Para la varianza de una población Normal con media conocida.

3.4. Intervalos de confianza asintóticos: Wald, Score and LRT.

4. Intervalos de confianza para los parámetros de dos poblaciones.

4.1. Intervalos de confianza con muestras independientes.

4.2. Intervalos de confianza para la diferencia de medias de dos poblaciones Normales con datos aparejados.

Tema 4: Tests de hipótesis.

1. Introducción.

1.1. Errores tipo I y II.

1.2. Función potencia.

1.3. Consistencia de las pruebas.

1.4. p-valores.

1.5. Dualidad entre los intervalos de confianza y los test de hipótesis.

2. Tests para los parámetros de una población.

2.1. Para la media de una población Normal con desviación conocida y desconocida.

2.2. Tests asintótico para la media de una población cuando la muestra es grande.

2.3. Para la varianza de una población Normal.

2.4. Tests asintóticos: Wald, Score y LRT.

3. Tests para los parámetros de dos poblaciones.

3.1. Tests de hipótesis con muestras independientes.

3.2. Tests de hipótesis con datos aparejados.

Tema 5. Regresión lineal simple.

1. Objetivos del modelo.

2. Estimadores de mínimos cuadrados ordinarios (MCO).

3. Inferencia con el modelo de regresión simple.

4. Predicciones.

IMPORTANTE: En la docencia, la perspectiva de género implica revisar los sesgos androcéntricos y cuestionar los supuestos y estereotipos de género ocultos. Esta revisión conlleva incluir a los contenidos de la asignatura el conocimiento producido por las mujeres científicas, a menudo olvidadas, procurando el reconocimiento de sus aportaciones, así como el de sus obras en las referencias bibliográficas


Metodología

La asignatura se estructura a partir de clases de teoría, problemas y prácticas.

En las clases de teoría iremos introduciendo los conceptos y técnicas que describe el programa del curso. Teniendo en cuenta que el contenido es esencialmente el estándar de un primer curso de inferencia estadística, se puede seguir haciendo uso de la bibliografía básica recomendada. También se irá colgando en el Campus Virtual el material correspondiente a cada tema explicado en las clases presenciales.

Las clases de problemas tienen por objetivo trabajar y entender los conceptos estadísticos. En el Campus Virtual se colgarán las listas de problemas.

El objetivo de las prácticas es la utilización de software estadístico R, para obtener y aclarar los resultados de los procedimientos que se han introducido en las clases de teoría y problemas. En el Campus Virtual se colgará el enunciado de cada práctica con antelación.

IMPORTANTE: Para trabajar más cómodamente con R, se recomienda utilizar la interfaz RStudio: es libre, "Open source" y funciona con Windows, Mac y Linux. https://www.rstudio.com/

OBSERVACIÓN: La perspectiva de género en la docencia va más allá de los contenidos de las asignaturas, ya que también implica una revisión de las metodologías docentes y de las interacciones entre el alumnado y el profesorado, tanto en el aula como fuera. En este sentido, las metodologías docentes participativas, donde se genera un entorno igualitario,menos jerárquico enel aula, evitando ejemplos estereotipados engéneroy vocabulario sexista, con el objetivo de desarrollar el razonamiento crítico y el respeto a la diversidad y pluralidad de ideas, personas y situaciones, suelen ser más favorables a la integración y plena participación de las alumnas en el aula, y por eso se procurará su implementación efectiva en esta asignatura.

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.


Actividades

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clase de problemas 12 0,48 5, 2, 3, 6, 7, 8, 9, 10, 11, 13, 14
Clases de prácticas 10 0,4 1, 5, 4, 7, 8, 9, 10, 11, 15, 16, 17
Clases de teoría 27 1,08 1, 5, 2, 3, 6, 7, 8, 9, 10, 11, 13, 14
Tipo: Autónomas      
Exámenes 15 0,6 1, 5, 2, 3, 6, 7, 8, 9, 10, 11, 13, 14
Resolución de problemas 33 1,32 1, 5, 2, 3, 6, 7, 8, 9, 10, 11, 13, 14
Resolución de prácticas 23 0,92 1, 5, 2, 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17

Evaluación

En las clases de teoría se introducirán los conceptos básicos de la asignatura y se presentará un amplio conjunto de ejemplos. En las clases de problemas y prácticas, se resolverán ejercicios y se realizarán prácticas con R. Se recomienda la asistencia a clase para tener una idea sobre el curso en general, así como de los ejercicios y prácticas.

 

Evaluación:

La calificación del estudiante será la media ponderada de las siguientes actividades:

PAC1: examen parcial, que supone el 25% de la nota.
PAC2: entrega de las hojas de respuestas de las prácticas de ordenador con R realizadas en el aula, lo que supone un 15% de la nota.
Examen final: que constará de algunas preguntas de tipo conceptual en forma de cuestiones cortas y de unos problemas en los que tendrá que resolver una serie de ejercicios similares a los que se han trabajado en las sesiones de clase. Esta prueba supone el 60% restante de la nota.

Importante: si la nota de alguna de estas actividades no alcanza el 3 sobre 10, contará como 0 en el cómputo de la calificación final.

Recuperación: si esta calificación no llega a 5, el estudiante tiene derecho a otra oportunidad de superar la asignatura mediante el examen de recuperación. En esta prueba podrá recuperarse el 85% de la nota correspondiente al examen final y al PAC1. La parte práctica con R (PAC2) no es recuperable. En ningún caso el examen de recuperación puede servir para subir la nota si el alumno ya ha superado la asignatura con el primer examen.

____________________________________________________________________________

 

Evaluación única:

El alumnado que se haya acogido a la modalidad de evaluación única deberá realizar una prueba final que consistirá en un examen que constará de algunas preguntas de tipo conceptual en forma de cuestiones cortas y de unos problemas en los que deberá resolver una serie de ejercicios similares a los que se han trabajado en las sesiones de clase. Cuando haya finalizado, entregará, además del examen, las hojas de respuestas de las prácticas de ordenador con R realizadas a lo largo del curso.

La calificación del estudiante será la media ponderada de las dos actividades anteriores, donde la prueba final supondrá el 85% de la nota, y la evaluación de las hojas de respuestas de las prácticas de ordenador con R el 15% restante.

Importante: si la nota de alguna de estas actividades no alcanza el 3 sobre 10, contará como 0 en el cómputo de la calificación final.

Si esta calificación no alcanza 5, el estudiante tiene derecho a otra oportunidad de superar la asignatura mediante el examen de recuperación que se celebrará en la fecha que fije la coordinación de la titulación. En esta prueba podrá recuperarse el 85% de la nota correspondiente a la prueba final. La parte práctica con R no es recuperable. En ningún caso el examen de recuperación puede servir para subir la nota si el alumno ya ha superado la asignatura con el primer examen.


Actividades de evaluación continuada

Título Peso Horas ECTS Resultados de aprendizaje
Examen final 0,60 10 0,4 1, 5, 2, 3, 6, 7, 8, 9, 10, 11, 13, 14
PEC1: Examen parcial 0,25 8 0,32 1, 5, 2, 3, 4, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17
PEC2: Ejercicios evaluables 0,15 12 0,48 1, 5, 2, 3, 6, 7, 8, 9, 10, 11, 12, 13, 14

Bibliografía

  1. Berger, R.L., Casella, G.: Statistical Inference. Duxury Advanced Series. 2002.
  2. Daalgard, P.: Introductory Statistics with R. Springer. 2008.
  3. Daniel, W.W.: Biostatistics. Wiley. 1974.
  4. DeGroot, M. H.: Schervish, M.J. Probability and Statistics. Pearson Academic. 2010.
  5. Delgado, R.: Probabilidad y Estadística con aplicaciones. 2018. https://www.amazon.es/Probabilidad-Estad%C3%ADstica-aplicaciones-Rosario-Delgado/dp/1983376906
  6. Peña, D.: Estadística. Fundamentos de estadística. Alianza Universidad. 2001.
  7. R Tutorial. An introduction to Statistics. https://cran.r-project.org/manuals.html. juny 2019.
  8. Silvey, S.D.: Statistical Inference. Chapman&Hall. 1975.
  9. Held, Sabanés and Bové (2013): Applied Statistical Inference: Likelihood and Bayes. Springer
  10. Pawitan (2013): In all Likelihood: Statistical Modelling and Inference using Likelihood. Oxford University Press
  11. Young, Smith (2005): Essentials of Statistical Inference. Cambridge University Press
  12. Cox, D.R. and Hinkley, D.V. (1979). Theoretical Statistics. 1st Edition, Chapman and Hall/CRC

Software

R Core Team (2021). R: A language and environment for statistical computing. R
  Foundation for Statistical Computing, Vienna, Austria. URL
  https://www.R-project.org/.