Logo UAB
2021/2022

Visualització de Dades

Codi: 104365 Crèdits: 6
Titulació Tipus Curs Semestre
2503758 Enginyeria de Dades OB 3 2
La metodologia docent i l'avaluació proposades a la guia poden experimentar alguna modificació en funció de les restriccions a la presencialitat que imposin les autoritats sanitàries.

Professor/a de contacte

Nom:
Enric Martí Godia
Correu electrònic:
Enric.Marti@uab.cat

Utilització d'idiomes a l'assignatura

Llengua vehicular majoritària:
català (cat)
Grup íntegre en anglès:
No
Grup íntegre en català:
Grup íntegre en espanyol:
No

Altres indicacions sobre les llengües

Un professor imparteix les seves classes en castellà, els altres dos usualment en català.

Equip docent

Guillermo Marin Getino
Judit Chamorro Servent

Prerequisits

Es recomana que l’alumnat tingui o repassi coneixements i conceptes de:

  • Anàlisi de grafs i cerca d’informació.
  • Ajust de models i optimització.
  • Aprenentatge computacional.
  • Anàlisi estadístic.

Objectius

L’assignatura pretén donar a l’alumne elements per a trobar la millor tècnica de visualització de dades que li permeti un millor anàlisi de les dades, o li permeti un tipus d’anàlisi específic.

CONEIXEMENTS: Al finalitzar el curs l'alumnat ha de ser capaç de:

  • Conèixer i comprendre els sistemes bàsics de visualització i d’anàlisi exploratori de dades.
  • Conèixer i comprendre els principals models de visualització.
  • Conèixer i comprendre les llibreries actuals per a la visualització de dades (Google Charts, JQuery plug-ins, D3.js)

HABILITATS: Es pretén que l'alumnat adquireixin les següents habilitats:

  • Donat un conjunt de dades, saber utilitzar el sistema i model de visualització més adient per a la visualització de dades que permeti l’anàlisi que es pretén fer.
  • Donat un conjunt de dades, saber utilitzar una de les llibreries de visualització de dades per a obtenir els millors resultats gràfics.

RESULTATS D’APRENENTATGE:

  1. Conèixer i comprendre els sistemes bàsics de visualització i d’anàlisi exploratori de dades.
  2. Conèixer i comprendre els principals models de visualització.
  3. Conèixer i comprendre les llibreries actuals per a la visualització de dades (Google Charts, JQuery plug-ins, D3.js)
  4. Saber aplicar les tècniques de visualització de dades més òptimes per a l’anàlisi de dades partir d’un cas concret.
  5. Treballar cooperativament.

Competències

  • Buscar, seleccionar i gestionar de manera responsable la informació i el coneixement.
  • Comprendre les tècniques de visualització de dades massives i poder seleccionar la més adequada per a l’anàlisi.
  • Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes destacats d'índole social, científica o ètica.

Resultats d'aprenentatge

  1. Buscar, seleccionar i gestionar de manera responsable la informació i el coneixement.
  2. Identificar les necessitats d'usabilitat i interactivitat d'un mètode de visualització de dades i ser capaç d'elaborar una nova versió de la visualització que millori els aspectes esmentats.
  3. Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes destacats d'índole social, científica o ètica.
  4. Relacionar les tècniques estadístiques i d'intel·ligència artificial amb les visualitzacions que expressen millor la informació subjacent.

Continguts

  1. 1. Introducció a la Visualització (2 hores)

     

    • Què és i per a què serveix?
    • Problema
    • Aplicacions i exemples

    2. Codificació Visual (2 hores)

    • Tipus de dades i tipus de gràfiques
    • Canals visuals
    • Triar gràfiques segons la seva funció

    3. Percepció visual i disseny (2 hores)

    • Percepció visual
    • Fonaments de disseny
    • Tipografia
    • Color

    4. Precisió visual (2 hores)

    • Erros comuns en la visualització
    • Honestedat visual
    • Bones i dolentes pràctiques en estadística

    5. Tractament de dades per a visualització (4 hores)

    • Uncertainity i Error
    • Reducció de dimensionalitat
    • Transformacions
    • Data massatge
    • Càlcul i selecció de mètriques rellevants

    6. Sistemes avançats de visualització (4 hores)

    • Múltiples variables i múltiples dimensions
    • Xarxes
    • Dades 3D
    • Camps de vectors
    • Visualització científica
    • Mapes

    7. Interacció. (4 hores)

    • Animació
    • Dashboards

    8. Metodologies de treball (2 hores)

    • Storytelling amb dades
    • Estrategies de planificació
    • Disseny centrat en l’usuari

    9. Validació (2 hores)

    • Usabilitat

Metodologia

 

PLATAFORMA VIRTUAL:  Caronte (http://caronte.uab.cat, grau d’Enginyeria de Dades, assignatura Visualització de Dades, curs VD Curs 2020-21).

El procés d'aprenentatge de l'alumnat es fonamenta en dos tipus d'activitats presencials (Teoria i Seminaris). L'assistència a les classes de teoria i de seminaris NO ÉS OBLIGATÒRIA, però SÍ MOLT RECOMANABLE.

TEORIA

Les classes de teoria s'imparteixen mitjançant classes magistrals amb transparències i pissarra. Tot el material del curs serà accessible a través de la Plataforma Virtual. Algunes de les sessions de teoria es dedicaran a resoldre exercicis plantejats a la mateixa aula amb l'objectiu d'aprofundir en els conceptes més rellevants i ensenyar a l'alumne a identificar i analitzar els errors típics.

SEMINARIS

En les sessions de seminaris alternarem dues activitats: problemes (7 sessions) i pràctiques (6 sessions).

En les sessions de PROBLEMES proposarem exercicis a resoldre sobre les següents temàtiques:

  • Gràfiques simples (barres, linees, boxplots, scatter, etc.) – Eina: R
  • Gràfiques complexes (coordenadas paralelas, small múltiples, xarxes, etc) – Eina: R
  • Altres eines (comerciales i lliures) – Eines: Tableau Public, DataWrapper, Gephi
  • Visualització de xarxes
  • Visualització de mapes
  • Gràfiques de dades multivariable i multidimensionals
  • Gràfiques animades i interactives – Eines: R, visor 3D 
  • Presentació (Títols, escales, llegendes i anotacions) – Eines: R i software de dissey com Inkscape
  • Dashboards – Eines: Tableau vs. R

En aquestes sessions de problemes es proposen els exercicis a resoldre, que els alumnes fan amb la tutorització del professor. Tota la documentació (enunciats scripts, resultats dels problemes) dels seminaris està disponible en la Plataforma Virtual.

En les sessions de PRÀCTIQUES es pretén capacitar a l’alumnat a estudiar i definir la diferents visualitzacions de conjunts de dades i valorar els avantatges i inconvenients. Proposarem dos treballs pràctics:

  1. Tractament amb un data set predeterminat. Donat un data set proporcionat pels professors, cal netejar, preparar i visualitzar amb gràfiques exploratòries, justificant quina és la millor.
  2. Tractament amb un data set lliure. A partir d’un data set triat o generat per l’alumnat, netejar, preparar i visualitzar amb gràfiques exploratòries, justificant quina és la millor.

Es realitzaran en grups de TRES persones i per a cada alumne es requerirà una dedicació de 12 hores en 6 sessions a on line tutelades per professor i 33 hores de treball de l'alumne de manera individual o grupal de preparació de les pràctiques, treball de l’alumne sense tutela del professor i l’elaboració d’informes.

L'assistència a les sessions online de pràctiques tutelades per professor  ÉS OBLIGATÒRIA. S'estudiaran casos d'absència a les sessions de pràctiques degudament justificats.

L'alumne prepara el treball de pràctiques explicat en l’enunciat de pràctiques. Aquesta preparació ha de ser prèvia a l'assistència a la sessióonlinede pràctiques corresponent. El treball es realitza assistint a les sessions online de pràctiques en els horaris establerts.

La normativa d'entrega i avaluació de pràctiques la podeu trobar en el document de normativa disponible en la Plataforma Virtual. S'avaluarà el treball de pràctiques realitzat i es farà un examen individual en l'entrega de cada pràctica.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.

Activitats formatives

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classes magistrals 26 1,04 2, 3, 4
Explicació i resolució de problemes 14 0,56 1, 2, 4
Resolució i d'exercicis pràctics 12 0,48 1, 2, 4
Tipus: Supervisades      
Casos pràctics 4 0,16 1, 2, 4
Tipus: Autònomes      
Estudi individual 26 1,04 2, 3, 4
Explicació i resolució de problemes 30 1,2 1, 2, 4
Resolució d'exercicis pràctics 30 1,2 1, 2, 4

Avaluació

L'avaluació de l’assignatura es fa de forma continuada, basada en dos indicadors: Teoria, seminaris:problemes i seminaris:pràctiques.

TEORIA

Hi haurà dos exàmens individuals per escrit, amb un pes del 50% cadascun sobre la Nota de Teoria. La primera prova (Par1) es farà aproximadament a la meitat del semestre i avaluarà els conceptes teòrics explicats fins a la data i la capacitat de resolució de problemes de visualització semblants als treballats en les sessions de seminaris:problemes. La segona prova (Par2) es realitzarà al final del semestre i avaluarà els conceptes explicats fins el moment, de teoria i la capacitat de resolució de problemes semblants als treballats en les sessions de seminaris:problemes.

Examen de recuperació: En cas de que la nota de teoria no arribi a l'aprovat, l’alumnat es podran presentar a un examen de recuperació sobre els continguts de l'examen parcial suspès.

PRÀCTICA

La nota del treball pràctic (Pract) realitzat en una sessió de seminaris té una puntuació d’un 1 punt que es sumarà a l’examen del primer parcial. Te dos indicadors:

  • Nota Grupal: (nota, PG) Entrega d’un informe en grup. Puntuació: 0,75 punts
  • Nota Individual (nota PI). Examen el dia de l’examen del primer parcial: Puntuació: 0,25 punts.

 

PROJECTE

La nota del projecte realitzat en sessions de seminaris té una puntuació 10. Te dos indicadors ponderats:

  • Nota Primera Entrega: (nota, Prj_1) Entrega d’un informe en grup. Ponderació: 40%
  • Nota Segona Entrega (nota Prj_2). Memòria ipresentació oral del projecte. Ponderació: 60%.

Recuperació: S’establirà una data per a la recuperació del projecte, tant per a la primera com la segona entrega.

INDICADORS DE QUALIFICACIÓ

La nota final de l'assignatura es calcula de la següent manera (entre parèntesi quadrat les notes mínimes per fer mitja):

  • Pract = PG + PI
  • Par1 = ExPar1 + Pract [ExPar1 >=4]  –--  Par2 = ExPar2
  • Nota Teoria = 0,4 * (Par1) + 0,6 * (Par2)  [Par1, Par2 >=5]
  • Nota Projecte = 0,4 * Prj_1 + 0,6 * Pr_2    [Pr_1, Pr_2 >=5]
  • Nota Pràctiques = 0,4 * Pr_1 + 0,60 * Pr_2    [Pr_i >=5, i=1..3]

NOTA FINAL ASSIGNATURA = 0,5* Nota Teoria + 0,5 * Nota Pràctiques                                     

 

 

La publicació de notes es farà mitjançant la Plataforma Virtual.

CRITERIS D'AVALUACIÓ

  • Per tal de poder calcular la NOTA FINAL ASSIGNATURA, caldrà superar totes les activitats avaluables (exàmens de Teoria, examen i entregues de pràctiques) amb un 5.
  • PERMANÈNCIA EN ELS EXAMENS: En qualsevol examen l’alumnat no podrà marxar de l’aula durant els primers 45 minuts del temps d’examen, excepte per causes justificades o per indicació del professorat.
  • En totes les recuperacions d’activitats avaluables (exàmens parcials o de practiques, projecte VD,etc.), la nota màxima serà 8.
  • MILLORAR LA NOTAD’UN EXAMEN: L’alumnat es pot presentar a una recuperació per a millorar nota d’un examen. Si entrega l’examen significa que renuncia a la nota anterior obtinguda. En cas de que no entregui significa que accepta la nota anterior obtinguda. 
  • NO AVALUABLE: Un alumne o alumna es considera No Avaluable (NA) únicament si no ha fet cap activitat d'avaluació. Recordem que la nota No Avaluable també corre convocatòria.
  • SUSPÈS: En el cas de no arribar al mínim exigit en alguna de les activitatsd'avaluació, si el càlcul de la nota final és igual osuperior a 5, es posarà un 4 denota a l'expedient.
  • MATRÍCULA D’HONOR: Podrà obtenir una MH l’alumna o alumne que tingui una nota igual o superior als 9 punts, a criteri del professor. Com que el nombre de MH no pot superar el 5% de l’alumnat matriculat, es concediran a aquells o aquelles que tinguin les notes finals més altes, a criteri del professor. Es concediran a l'alumnat que hagi realitzat totes les proves avaluatives en primera convocatòria.
  • REPETIDORS: No es convalida cap part aprovada per separat (Teoria, Examen SQL, Informe Tècnic) d’un curs acadèmic a un altre.
  • IMPORTANT PER A TOTS ELS ALUMNES: És important inscriure's a la Plataforma Virtual a principi de curs doncs s’hi publiquen els materials de l'assignatura, es fan les entregues de l’informe Tècnic i es publiquen les notes de l'assignatura. Si és la primera vegada que entreu a Caronte cal que proporcioneu el vostre NIU, contrasenya, nom i cognoms, email i una foto carnet en format JPG. Caronte es un gestor diferent al Campus Virtual de la UAB, amb el que no fa falta que les contrasenyes siguinlamateixa.

CALENDARI D'AVALUACIÓ:

 
  • Exàmens Parcials: Dates al final de la guia docent, que es publicarà en la Plataforma Virtual i que es donarà a l’alumnat el primer dia de classe.
  • Exàmens de Recuperació: Segons calendari acadèmic de l'Escola d'Enginyeria.
  • Exàmens i entregues de pràctiques: Dates en la normativa de pràctiques, que es publicarà en la Plataforma Virtual.
 

Les dates d'avaluació contínua i de lliurament de treballs es publicaran a la Plataforma Virtual i poden estar subjectes a canvis de programació per motius d'adaptació a possibles incidències. Sempre s'informarà a la Plataforma Virtual sobre aquests canvis ja que s'entén que aquest és el mitjà habitual d'intercanvi d'informació entre professors i alumnat fora de l’aula.

Sense perjudici d'altres mesures disciplinàries que s'estimin oportunes, i d'acord amb la normativa acadèmica vigent, les  irregularitats comeses per un alumne o alumna que puguin conduir a una variació de la qualificació es qualificaran amb un zero (0). Les  activitats d'avaluació qualificades d'aquesta forma i per aquest procediment no seran recuperables. Si és necessari superar qualsevol d'aquestes activitats d'avaluació per a aprovar l'assignatura, aquesta  quedarà suspesa directament, sense oportunitat de  recuperar-la en el mateix curs. Aquestes irregularitats inclouen, entre d'altres:

  • La còpia total o parcial d'una pràctica,informe, o qualsevol altra activitat d'avaluació
  • Deixar copiar.
  • Presentar un treball de grup no fet íntegrament pels membres del grup.
  • Presentar com a propis materials elaborats per un tercer, encara que  siguin traduccions o adaptacions, i en general treballs amb elements no originals i exclusius de l’alumna o alumne.
  • Tenir dispositius de comunicació (com telèfons mòbils, smart watches, etc.) accessibles durant les proves d'avaluació teòric-pràctiques individuals (exàmens).

Amb les excepcions de que s'atorgarà la qualificació de "no avaluable" a l’alumnatque no participien cap de les activitats d'avaluació, i de que la nota numèrica de l'expedient serà el valor menor entre 3,0 i la mitjana ponderada de les notes en cas que l'alumne oalumna hagi comès irregularitats en un acte d'avaluació (i per tant no serà possible l'aprovat per compensació).

EN RESUM: copiar, deixar copiar o plagiar en qualsevol de les activitats d'avaluació equival a un SUSPENS amb nota inferior a 3,5.

Activitats d'avaluació

Títol Pes Hores ECTS Resultats d'aprenentatge
Nota de Teoria (exàmens parcials) 50% 4 0,16 2, 3, 4
Nota de pràctiques (examen i lliuraments) 50% 4 0,16 1, 2, 4

Bibliografia

MATERIAL DE L’ASSIGNATURA (apunts, transparències, articles): En la Plataforma Virtual.

BIBLIOGRAFIA BÀSICA:

  • T. Munzner, Visualization Analysis & Design, CRC Press, 2014.

BIBLIOGRAFIA COMPLEMENTÀRIA:

  • S. Few, Information Dashboard Design: Displaying Data for At-a-glance Monitoring, 2nd edition, Analytics Press, 2013.
  • A. Cairo, The truthful art. Data, charts and maps for communication, New Riders, 2016.
  • A. Kirk, Data Visualization. A handbook for Data Driven Design, 2nd edition, SAGE Publications, 2019.
  • C.O. Wilke, Fundamentals of Data Visualization. A Primer on Making Informative and Compelling Figures, O’Reilly Media, 2019.

Programari

En aquesta assignatura utilitzarem el següent programari:

  • Software R: R is ‘GNU S’, a freely available language and environment for statistical computing and graphics which provides a wide variety of statistical and graphical techniques. Ens podem descarregar l’entorn en el link: https://cran.rstudio.com/ .
  • RStudio: Es tracta d’un framework que treballa sobre R i Python. Es pot descarregar de forma gratuïta en diferents plataformes (Windows, MacOs, Linux) en https://www.rstudio.com/products/rstudio/ .
  • Tableau és una eina d’anàlisi i visualització de dades potent utilitzada en l’àrea de Business Intelligence. Disposem d’una llicència educativa per a que la pugui utilitzar el nostre alumnat. També ens podem baixar una versió de demo gratuïta en el link: https://www.tableau.com/es-es/why-tableau/what-is-tableau .

Tot el programari que s'utilitzarà és de lliure accés o s’oferirà gratuïtament a l’alumnat amb llicències educacionals.