Logo UAB
2022/2023

Ciència de Dades

Codi: 104540 Crèdits: 6
Titulació Tipus Curs Semestre
2503743 Gestió de Ciutats Intel·ligents i Sostenibles OB 2 2

Professor/a de contacte

Nom:
Dimosthenis Karatzas
Correu electrònic:
dimosthenis.karatzas@uab.cat

Utilització d'idiomes a l'assignatura

Llengua vehicular majoritària:
espanyol (spa)
Grup íntegre en anglès:
No
Grup íntegre en català:
No
Grup íntegre en espanyol:

Altres indicacions sobre les llengües

El material escrit de l'assignatura es prepararà en anglès.

Prerequisits

Haver cursat les assignatures Informàtica, Matemàtiques, Programació d'aplicacions a Internet, de primer curs, i Bases de Dades de segon curs.

Objectius

Aquesta assignatura ha de permetre a l'estudiant conèixer les tecnologies existents i les diverses formes d'abordar la gestió i anàlisi de les dades generades per la ciutat diàriament.

Els estudiants aprendran tècniques de visualització, anàlisi i modelatge de dades que els permetran generar nou coneixement i percepcions a partir de les dades de la ciutat.

 

Competències

  • Demostrar creativitat, iniciativa i sensibilitat envers els temes socials i mediambientals.
  • Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
  • Que els estudiants sàpiguen aplicar els coneixements propis a la seva feina o vocació d'una manera professional i tinguin les competències que se solen demostrar per mitjà de l'elaboració i la defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi.
  • Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes destacats d'índole social, científica o ètica.
  • Resoldre problemes de gestió urbana utilitzant coneixements, metodologies i procediments de disseny i implementació d'aplicacions informàtiques per a diferents tipus d'entorns (web, mòbil, núvol) i amb diferents paradigmes.
  • Treballar cooperativament en entorns complexos o incerts i amb recursos limitats, en un context multidisciplinari, assumint i respectant el rol dels diferents membres de l'equip.

Resultats d'aprenentatge

  1. Aplicar tècniques de presa de decisions automatitzada.
  2. Demostrar creativitat, iniciativa i sensibilitat envers els temes socials i mediambientals.
  3. Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
  4. Que els estudiants sàpiguen aplicar els coneixements propis a la seva feina o vocació d'una manera professional i tinguin les competències que se solen demostrar per mitjà de l'elaboració i la defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi.
  5. Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes destacats d'índole social, científica o ètica.
  6. Treballar cooperativament en entorns complexos o incerts i amb recursos limitats, en un context multidisciplinari, assumint i respectant el rol dels diferents membres de l'equip.

Continguts

  • Preparació de dades
    • Visualització de dades
    • Normalització
    • Valors desconeguts
    • Reducció de dimensionalitat
    • Selecció de característiques
  • Classificació i regressió (tècniques supervisades)
    • Regressió lineal i polinomial
    • Regressió logística
    • Probabilitats, Classificador Naive Bayes
    • Arbres de decisió i "random forests"
    • Classificació jerárquica
  • Generació de coneixement (tècniques no supervisades)
    • Regles d'associació
    • Sistemes de recomanació

Metodologia

La ciència de dades es defineix pels tipus de problemes que pretén resoldre; per tant, serà aquesta tipologia de problemes la que dirigirà l'organització de tots els continguts.

Hi haurà tres tipus d'activitats: classes teòriques, resolució d'exercicis pràctics de forma individual (problemes) i desenvolupament de projectes en petits equips.

1. Classes de teoria: L'objectiu d'aquestes sessions és que el professor expliqui els antecedents teòrics de l'assignatura. Per a cada un dels temes estudiats s'explica la teoria i formulació matemàtica, així com les corresponents solucions algorítmiques.

2. Sessions de laboratori: Les sessions de laboratori tenen com a objectiu facilitar la interacció i reforçar la comprensió dels temes vistos a les classes de teoria. Durant les sessions de laboratori abordarem dos tipus d'activitats: la resolució d'exercicis pràctics i la realització de seguiment i presentacions de projectes.

2.1 Problemes: S'utilitzarà un conjunt setmanal de problemes a treballar, que requereixen la implementació de mètodes vistos a les classes de teoria. El treball sobre els problemes s'iniciarà a classe i cada estudiant ha de completar individualment a casa. Es requerirà que els estudiants realitzin un enviament setmanal del seu treball, que inclourà el portafoli de problemes.

2.2 Projectes: Les sessions de projectes comprenen activitats relacionades amb la realització de dos projectes curts durant el semestre. Els estudiants treballaran en col·laboració en aquests projectes en petits equips. Durant les sessions de projectes (1) el professor presentarà la temàtica dels projectes i discutirà possibles enfocaments, i (2) els equips presentaran els seus resultats finals.Els equips hauran de dissenyar i implementar una solució, gestionar la distribució i organització de la feina a realitzar i presentar els resultats finals a l'docent.

Les activitats anteriors es complementaran amb un sistema de tutories i consultes fora de l'horari de classes.

Tota la informació de l'assignatura i els documents relacionats que necessitin els alumnes estaran disponibles al campus virtual (cv.uab.cat).

La competència transversal T01 s'aborda a través de la feina en equip i la col·laboració durant el desenvolupament dels projectes. L'avaluació dels projectes inclou una presentació oral de cada equip, durant la qual els alumnes hauran de presentar el seu treball i explicar l'organització de l'equip.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.

Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classe de Teoria 26 1,04 3, 4, 5
Sessions de Problemes 12 0,48 1, 3
Tipus: Supervisades      
Sessions de Projectes 12 0,48 1, 3, 4, 5, 6
Tutories 5 0,2 1, 3, 4, 5
Tipus: Autònomes      
Dedicació a les pràctiques (projectes) 37 1,48 1, 4, 5, 6
Dedicació als problemes 12 0,48 1, 4, 5
Lectura i estudi de material 40 1,6 1

Avaluació

Per avaluar el nivell d'aprenentatge de l'estudiant s'estableix una fórmula que combina l'aprenentatge de coneixements, la capacitat de resolució de problemes i les capacitats de treballar en equip, així com de la presentació dels resultats obtinguts.

Nota Final

La nota final es calcula ponderadament de la següent manera i d'acord amb les diferents activitats que es duen a terme:

Nota final = 0.4* Nota Teoria + 0.1 * Nota Problemes + 0.5 * Nota de Projectes

S'aplicarà aquesta fórmula sempre que la nota de teoria i la nota de pràctiques siguin més gran que 5. No hi ha cap restricció sobre la nota de problemes. Si fent el càlcul de la fórmula surt >= 5, però no arriba al mínim exigit en alguna de les activitats d'avaluació, llavors la nota que es posarà en l'expedient serà de 4.5.

Nota de Teoria

La nota de teoria pretén valorar les capacitats individuals de l'estudiant pel que fa als continguts teòrics de l'assignatura, això es fa de forma continuada durant el curs amb dos exàmens parcials:

Nota Teoria = 0.5 * Nota Examen 1 + 0.5 * Nota Examen 2

Examen 1 es fa a la meitat del semestre i serveix per eliminar part de la matèria si s'aprova.

Examen 2 es fa al final del semestre i serveix per eliminar part de la matèria si s'aprova.

Aquests exàmens pretenen fer una avaluació individualitzada de les capacitats de cada estudiant per a resoldre problemes utilitzant les tècniques explicades a classe, així com avaluar el nivell de conceptualització que l'estudiant ha fet de les tècniques vistes. Per poder tenir una nota de teoria serà necessari que les notes dels exàmens 1 i 2 siguin superiors a 4.

Examen de recuperació. En cas que la nota de teoria no arribi al nivell adequat per aprovar la teoria, els estudiants es poden presentar a un examen de recuperació, destinat a recuperar la part no superada de l'avaluació contínua.

Nota de Problemes

La part de problemes té com a objectiu aconseguir que l'estudiant s'entreni amb els continguts de l'assignatura de manera continuada i que es familiaritzi directament en l'aplicació de la teoria. Com evidència d'aquest treball es demana la presentació d'un portfoli en el qual s'aniran guardant els problemes realitzats.

Per tenir nota de problemes, cal que es lliurin mes que 50% dels problemes fets durant el semestre. En cas contrari la nota de problemes serà 0.

Nota Problemes = Avaluació del portfoli

Nota de Projectes 

La part de projectes té un pes essencial en la nota global de l'assignatura i requereix que els estudiants treballin en equips i dissenyin una solució integral a l'repte definit. A més, els estudiants han de demostrar les seves habilitats per treballar en equip i presentar els resultats.

Cadascun dels dos projectes s'avalua a través del seu lliurable, una presentació oral que faran els estudiants a classe, i un procés d'autoavaluació per part dels estudiants. La participació dels estudiants a les tres activitats (desenvolupar el lliurable, presentar i omplir el formulari d'autoavaluació) és necessària per tenir nota de projecte. La nota es calcula de la següent manera:

Nota Projecte X = 0.6 * Nota Lliurables + 0.3 * Nota Presentació + 0.1 * Nota Autoavaluació

Si fent el càlcul de la fórmula surt> = 5, però l'estudiant no hagi participat en alguna de les activitats (lliurable, presentació o autoavaluació), llavors la nota d'el projecte corresponent serà de 4.5.

Nota de  Projectes = 0.5 * Nota Projecte 1 + 0.5 * Nota Projecte 2

Per poder tenir una nota de projectescaldrà que les notes dels dos projectes siguin superiors a 4.

En cas de no superar algun dels projectes es permetrà la recuperació dels projectes no superats, amb la restricció a una nota màxima de 7/10.

Notes importants

Sense perjudici d'altres mesures disciplinàries que s'estimin oportunes, i d'acord amb la normativa acadèmica vigent, la comissió d'activitats irregulars per part de l'estudiant (per exemple, plagiar, copiar, deixar copiar, ...) implicarà suspendre l'activitat corresponent amb un zero (0). Les activitats d'avaluació qualificades d'aquesta forma i per aquest procediment no seran recuperables.

En cas que no es faci cap lliurament de problemes, no s'assisteixi a cap sessió de presentació dels projectes en pràctiques de laboratori i no es faci cap examen, la nota corresponent serà un "no avaluable". En un altre cas, els "no presentats" computen com un 0 per al càlcul de la mitjana ponderada.

Per obtenir matrícula d'honor, la qualificació final ha de ser igual o superior a 9 punts. El nombre d'estudiants està inscrit al curs, se li atorga a qui tingui la qualificació final més alta. En cas d'empat, es veuran en compte els resultats dels exàmens parcials.

Activitats d'avaluació

Títol Pes Hores ECTS Resultats d'aprenentatge
Autoavaluació 5 0 0 6
Exámens 40 5 0,2 3, 4
Lliurables de problemes 10 0 0 1, 5
Lliurables de projectes 30 0 0 1, 2, 4, 5, 6
Presentació de projectes 15 1 0,04 3, 4, 6

Bibliografia

  • Data Science from Scratch: First Principles with Python, Joel Grus, O'Reilly Media, 2015, 1st Ed.
  • Python Data Science Handbook, Jake VanderPlas, O’Reilly Media, 2016, 1st Ed.
  • Pattern Recognition and Machine Learning, Christopher Bishop, Springer, 2011
  • Model-Based Machine Learning, J. Winn, C. Bishop, early access: http://mbmlbook.com/
  • Computational and Inferential Thinking: The Foundations of Data Science, Ani Adhikari and John DeNero, online: https://ds8.gitbooks.io/textbook/content/

Programari

Per als problemes i projectes del curs utilitzarem Python i els mòduls Python: NumPy, MatPlotLib, SciKit Learn, Pandas