Logo UAB
2022/2023

Ciencia de Datos

Código: 104540 Créditos ECTS: 6
Titulación Tipo Curso Semestre
2503743 Gestión de Ciudades Inteligentes y Sostenibles OB 2 2

Contacto

Nombre:
Dimosthenis Karatzas
Correo electrónico:
dimosthenis.karatzas@uab.cat

Uso de idiomas

Lengua vehicular mayoritaria:
español (spa)
Algún grupo íntegramente en inglés:
No
Algún grupo íntegramente en catalán:
No
Algún grupo íntegramente en español:

Otras observaciones sobre los idiomas

El material escrito de la asignatura se preparará en inglés.

Prerequisitos

Haber cursado las asignaturas Informática, Matemáticas, Programación de aplicaciones en Internet, de primer curso, y Bases de Datos de segundo curso.

Objetivos y contextualización

Esta asignatura debe permitir al estudiante conocer las tecnologías existentes y las diversas formas de abordar la gestión y análisis de los datos generados por la ciudad a diario.

Los estudiantes aprenderán técnicas de visualización, análisis y modelaje de datos que les permitirán generar nuevo conocimiento y percepciones a partir de los datos de la ciudad.

Competencias

  • Demostrar creatividad, iniciativa y sensibilidad hacia los temas sociales y medioambientales.
  • Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • Resolver problemas de gestión urbana utilizando conocimientos, metodologías y procedimientos de diseño e implementación de aplicaciones informáticas para diferentes tipos de entornos (web, móvil, nube) y con diferentes paradigmas.
  • Trabajar cooperativamente, en entornos complejos o inciertos y con recursos limitados, en un contexto multidisciplinar, asumiendo y respetando el rol de los diferentes miembros del equipo.

Resultados de aprendizaje

  1. Aplicar técnicas de toma de decisiones automatizada.
  2. Demostrar creatividad, iniciativa y sensibilidad hacia los temas sociales y medioambientales.
  3. Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  4. Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  5. Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  6. Trabajar cooperativamente, en entornos complejos o inciertos y con recursos limitados, en un contexto multidisciplinar, asumiendo y respetando el rol de los diferentes miembros del equipo.

Contenido

  • Preparación de datos
    • Visualización de datos
    • Normalización
    • Valores desconocidos
    • Reducción de dimensionalidad
    • Selección de características
  • Clasificación y regresión (técnicas supervisadas)
    • Regresión lineal y polinomial
    • Regresión logística
    • Probabilidades, Clasificador Naive Bayes
    • Arboles de decisión y “random forests”
    • Clasificación jerárquica
  • Generación de conocimiento (técnicas no supervisadas)
    • Reglas de asociación
    • Sistemas de recomendación

 

Metodología

La ciencia de datos se define por los tipos de problemas que pretende resolver; por tanto, será esa tipología de problemas la que dirigirá la organización de todos los contenidos.

Habrá tres tipos de actividades: clases teóricas, resolución de ejercicios prácticos de forma individual (problemas) y desarrollo de proyectos en pequeños equipos.

1. Clases de teoría: El objetivo de estas sesiones es que el profesor explique los antecedentes teóricos de la asignatura. Para cada uno de los temas estudiados se explica la teoría y formulación matemática, así como las correspondientes soluciones algorítmicas.

2. Sesiones de laboratorio: Las sesiones de laboratorio tienen como objetivo facilitar la interacción y reforzar la comprensión de los temas vistos en las clases de teoría. Durante las sesiones de laboratorio abordaremos dos tipos de actividades: la resolución de ejercicios prácticos y la realización de seguimiento y presentaciones de proyectos.

2.1 Problemas: Se utilizará un conjunto semanal de problemas a trabajar, que requieren la implementación de métodos vistos en las clases de teoría. El trabajo sobre los problemas se iniciará en clase y cada estudiante debe completarlo individualmente en casa. Se requerirá que los estudiantes realicen un envío semanal de su trabajo, que incluirá el portafolio de problemas.

2.2 Proyectos: Las sesiones de proyectos comprenden actividades relacionadas con la realización de dos proyectos cortos durante el semestre. Los estudiantes trabajarán en colaboración en estos proyectos en pequeños equipos. Durante las sesiones de proyectos (1) el profesor presentará la temática de los proyectos y discutirá posibles enfoques, y(2) los equipos presentarán sus resultados finales. Los equipos deberán diseñar e implementar una solución, gestionar la distribución y organización del trabajo a realizar y presentar los resultados finales al docente.

Las actividades anteriores se complementarán con un sistema de tutorías y consultas fuera del horario de clases.

Toda la información de la asignatura y los documentos relacionados que necesiten los alumnos estarán disponibles en el campus virtual (cv.uab.cat).

La competencia transversal T01 se aborda a través del trabajo en equipo y la colaboración durante el desarrollo de los proyectos. La evaluación de los proyectos incluye una presentación oral de cada equipo, durante la cual los alumnos deberán presentar su trabajo y explicar la organización del equipo.

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.

Actividades

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clase de Teoría 26 1,04 3, 4, 5
Sesiones de Problemas 12 0,48 1, 3
Tipo: Supervisadas      
Sesiones de Proyectos 12 0,48 1, 3, 4, 5, 6
Tutorías 5 0,2 1, 3, 4, 5
Tipo: Autónomas      
Dedicación a las prácticas (proyectos) 37 1,48 1, 4, 5, 6
Dedicación a los problemas 12 0,48 1, 4, 5
Lectura y estudio de material 40 1,6 1

Evaluación

Para evaluar el nivel de aprendizaje del estudiante se establece una fórmula que combina el aprendizaje de conocimientos, la capacidad de resolución de problemas y las capacidades de trabajar en equipo, así como de la presentación de los resultados obtenidos.

Nota Final

La nota final se calcula ponderadamente de la siguiente manera y de acuerdo con las diferentes actividades que se llevan a cabo:

Nota final = 0.4 * Nota Teoría + 0.1 * Nota Problemas + 0.5 * Nota de Proyectos

Se aplicará esta fórmula siempre que la nota de teoría y la nota de prácticas sean mayor que 5. No hay ninguna restricción sobre la nota de problemas. Si haciendo el cálculo de la fórmula sale >= 5, pero no llega al mínimo exigido en alguna de las actividades de evaluación, entonces la nota que se pondrá en el expediente será de 4.5.

Nota de Teoría

La nota de teoría pretende valorar las capacidades individuales del estudiante en cuanto a los contenidos teóricos de la asignatura, esto se hace de forma continuada durante el curso con dos exámenes parciales:

Nota Teoría = 0.5 * Nota Examen 1 + 0.5 * Nota Examen 2

Examen 1 se hace en la mitad del semestre y sirve para eliminar parte de la materia si se aprueba.

Examen 2 se hace al final del semestre y sirve para eliminar parte de la materia si se aprueba.

Estos exámenes pretenden hacer una evaluación individualizada de las capacidades de cada estudiante para resolver problemas utilizando las técnicas explicadas en clase, así como evaluar el nivel de conceptualización que el estudiante ha hecho de las técnicas vistas. Para poder tener una nota de teoría será necesario que las notas de los exámenes 1 y 2 sean superiores a 4.

Examen de recuperación. En caso de que la nota de teoríano llegue al nivel adecuado para aprobar la teoría, los estudiantes se pueden presentar a un examen de recuperación, destinado a recuperar la parte no superada de la evaluación continua.

Nota de Problemas

La parte de problemas tiene como objetivo conseguir que el estudiante se entrene con los contenidos de la asignatura de manera continuada y que se familiarice directamente en la aplicación de la teoría. Como evidencia de este trabajo se pide la presentación de un portafolio en el que se irán guardando los problemas realizados.

Para tener nota de problemas, es necesario que se entreguen mas que 50% de los problemas hechos durante el semestre. En caso contrario la nota de problemas será 0.

Nota Problemas = Evaluación del portfolio

Nota de Proyectos

La parte de proyectos tiene un peso esencial en la nota global de la asignatura y requiere que los estudiantes trabajen en equipos y diseñen una solución integral al reto definido. Además, los estudiantes deben demostrar sus habilidades para trabajar en equipo y presentar los resultados.

Cada uno de los dos proyectos se evalúa a través de su entregable, una presentación oral que harán los estudiantes en clase, y un proceso de autoevaluación por parte de los estudiantes. La participación de los estudiantes a las tres actividades (desarrollar el entregable, presentar y rellenar el formulario de autoevaluación) es necesaria para tener nota de proyecto. La nota se calcula de la siguiente manera:

Nota Proyecto X = 0.6 * Nota Entregable + 0.3 * Nota Presentación + 0.1 * Nota Autoevaluación

Si haciendo el cálculo de la fórmula sale >= 5, pero el estudiante no haya participado en alguna de las actividades (entregable, presentación o autoevaluación), entonces la nota del proyecto correspondiente será de 4.5.Nota de Proyectos = 0.5 * Nota Proyecto 1 + 0.5 * Nota Proyecto 2

Para poder tener una nota de proyectos será necesario que las notas de los dos proyectos sean superiores a 4.

En caso de no superar alguno de los proyectos se permitirá la recuperación del proyecto con la restricción a una nota máxima de 7/10.

Notas importantes

Sin perjuicio de otras medidas disciplinarias que se estimen oportunas, y de acuerdo con la normativa académica vigente, la comisión de actividades irregulares por parte del estudiante (por ejemplo, plagiar, copiar, dejar copiar, …) implicará suspender la actividad correspondiente con un cero (0). Las actividades de evaluación calificadas de esta forma y por este procedimiento no serán recuperables.

En caso de que no se haga ninguna entrega de problemas, no se asista a ninguna sesión de presentación de los proyectos en prácticas de laboratorio y no se haga ningún examen, la nota correspondiente será un "no evaluable". En otro caso, los "no presentados" computan como un 0 para el cálculo de la media ponderada.

Para obtener matrícula de honor, la calificación final debe ser igual o superior a 9 puntos. Debido a que el número de estudiantes con esta distinción no puede exceder el 5% del número total de estudiantes inscritos en el curso, se le otorga a quien tenga la calificación final más alta. En caso de empate, se tendrán en cuenta los resultados de los exámenes parciales.

Actividades de evaluación

Título Peso Horas ECTS Resultados de aprendizaje
Autoevaluación 5 0 0 6
Entregables de problemas 10 0 0 1, 5
Entregables de proyectos 30 0 0 1, 2, 4, 5, 6
Exámenes 40 5 0,2 3, 4
Presentación de proyectos 15 1 0,04 3, 4, 6

Bibliografía

  • Data Science from Scratch: First Principles with Python, Joel Grus, O'Reilly Media, 2015, 1st Ed.
  • Python Data Science Handbook, Jake VanderPlas, O’Reilly Media, 2016, 1st Ed.
  • Pattern Recognition and Machine Learning, Christopher Bishop, Springer, 2011
  • Model-Based Machine Learning, J. Winn, C. Bishop, early access: http://mbmlbook.com/
  • Computational and Inferential Thinking: The Foundations of Data Science, Ani Adhikari and John DeNero, online: https://ds8.gitbooks.io/textbook/content/

Software

Para los problemas y proyectos del curso usaremos Python, y los módulos de Python: NumPy, MatPlotLib, SciKit Learn, Pandas