Logo UAB

Gestió de Dades

Codi: 106566 Crèdits: 6
2025/2026
Titulació Tipus Curs
Intel·ligència Artificial / Artificial Intelligence OB 3

Professor/a de contacte

Nom:
Javier Panadero Martinez
Correu electrònic:
javier.panadero@uab.cat

Equip docent

Haoyuan Li

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Encara que no hi ha prerequisits formalment establerts i és responsabilitat de la pròpia assignatura proporcionar als i les alumnes un mitjà per adquirir els coneixements descrits a l’apartat de continguts de l’assignatura. És recomanable: un bon coneixement de programació, del funcionament d'un computador, del sistema operatiu a nivell d'usuari programador i dels sistemes de bases de dades relacionals i no relacional.


Objectius

L'objectiu d'aquesta assignatura és conèixer els conceptes fonamentals dels Sistemes Distribuïts i els paradigmes de processament massiu de dades. Es veuran models de programació per aplicacions de processament "batch", en memòria i en "streaming". Arquitectures d'aplicacions i revisió de conceptes rellevants respecte al tractament de les dades com integritat, accessibilitat, fiabilitat, consistència i seguretat en el processament de dades a gran escala.


Competències

  • Analitzar i resoldre problemes de manera efectiva, i generar propostes innovadores i creatives per aconseguir els objectius.
  • Conceptualitzar i modelar alternatives de solucions complexes per a problemes d’aplicació de la intel·ligència artificial en diferents àmbits, i planificar i gestionar projectes per al disseny i desenvolupament de prototips que demostrin la validesa del sistema proposat.
  • Conèixer i utilitzar de manera eficient les tècniques i eines de representació, manipulació, anàlisi i gestió de dades a gran escala.
  • Introduir canvis en els mètodes i els processos de l’àmbit de coneixement per donar respostes innovadores a les necessitats i demandes de la societat. 
  • Que els estudiants hagin demostrat que comprenen i tenen coneixements en una àrea d'estudi que parteix de la base de l'educació secundària general, i se sol trobar a un nivell que, si bé es basa en llibres de text avançats, inclou també alguns aspectes que impliquen coneixements procedents de l'avantguarda d'aquell camp d'estudi.
  • Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.

Resultats d'aprenentatge

  1. Analitzar i resoldre problemes de manera efectiva, i generar propostes innovadores i creatives per aconseguir els objectius.
  2. Concebre, dissenyar i implementar processos de recopilació i anotació de dades adequats al problema concret a resoldre.
  3. Conèixer els conceptes bàsics de sistemes distribuïts de dades i l’ús d’eines de processament massiu de dades.
  4. Escollir els mètodes d’emmagatzematge més apropiats que permetin una posterior recuperació i anàlisi de dades eficient.
  5. Proposar nous mètodes o solucions alternatives fonamentades.
  6. Que els estudiants hagin demostrat que comprenen i tenen coneixements en una àrea d'estudi que parteix de la base de l'educació secundària general, i se sol trobar a un nivell que, si bé es basa en llibres de text avançats, inclou també alguns aspectes que impliquen coneixements procedents de l'avantguarda d'aquell camp d'estudi.
  7. Treballar cooperativament per aconseguir objectius comuns, assumint la pròpia responsabilitat i respectant el rol dels diferents membres de l’equip.

Continguts

1. Introducció a les aplicacions massives de dades

2. Conceptes fonamentals del tractament de dades en entorns massius: fiabilitat, escalabilitat, sostenibilitat. Models de dades i llenguatges de consulta.

3. Gestió de grans volums de dades. Data warehousing. Principis dels sistemes Data warehousing, Business intelligence, modelització multidimensional, operadors OLAP, esquema en estrella, procès ETL

4. Introducció a les bases de dades a memòria amb Redis

5. Aplicacions amb gran volums de dades amb eines Apache. Introducció a les eines i ecosistema Apache Spark per a processar grans volums de dades. Utilització de Dataframes i MLib


Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Estudi de casos d'ús 9 0,36 1, 2, 5, 7
Pràctiques 12 0,48 2, 3, 4, 7
Teoria 20 0,8 2, 3, 4, 6
Tipus: Autònomes      
Estudi autònom 30 1,2 1, 3, 4, 6
Preparació de casos d'estudi 20 0,8 1, 2, 3, 4, 5, 7
Preparació de laboratoris 32 1,28 1, 2, 7

En el desenvolupament de l'assignatura es podran diferenciar els següents tipus d’activitats docents:

Classes teòriques: exposició de la part teòrica de cada tema del programa. L'estructura típica d'una classe d'aquest tipus serà la següent: en primer lloc es farà una introducció on es presentaran breument els objectius de l'exposició i els continguts a tractar. A continuació es desgranaran els continguts objecte d’estudi, incloent exposicions narratives, desenvolupaments formals que proporcionin els fonaments teòrics, i intercalant exemples, que il·lustrin l'aplicació dels continguts exposats. Finalment, el/la professor/a exposarà les conclusions dels continguts. Durant tot el curs hi hauran avaluacions continuades de grups de temes.

Sessions de laboratori. La part pràctica dels temes teòrics quedarà completada amb sessions al laboratori, on l'estudiant desenvoluparà una sèrie de programes i haurà d'intentar resoldre problemes concrets que seran publicats al començar el temari. Alguns d’aquests exercicis s’hauran d’entregar al campus virtual en les dates especificades. Les pràctiques es desenvoluparan en grups de dos estudiants. Les classes inclouen un conjunt de 6 sessions al laboratori, de 2 hores de durada, on l’alumne realitzarà el desenvolupament dels enunciats publicats.

Problemes: revisió de casos pràctics. Es presentarà una llista de casos pràctics amb reptes de dades relacionats amb objectius d’anàlisi de negoci a realitzar. Els estudiants treballaran en grup per presentar les conclusions del seu estudi de forma oral a unes sessions determinades i es realitzarà una avaluació en grup dels treballs presentats.

Aquest plantejament del treball està orientat a promoure un aprenentatge actiu i a desenvolupar les competències de capacitat d'organització i planificació, comunicació oral i escrita, treball en equip i raonament crític. La qualitat dels exercicis realitzats, de la seva presentació i del seu funcionament es valorarà especialment.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, perquè els alumnes completin les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Control individual 1 30% 2 0,08 1, 3, 6
Control individual 2 30% 2 0,08 1, 3, 6
Laboratoris de pràctiques 40% 23 0,92 1, 2, 3, 4, 5, 7

Aquesta assignatura no preveu el sistema d’avaluació única. Els estudiants repetidors hauran de realitzar totes les activitats planificades, tant teòriques com pràctiques, es a dir, no hi haurà un tractament diferenciat per als estudiants repetidors.

L’assignatura consta de tres parts: Teoria, Problemes i Pràctiques. La part de Teoria i Problemes representa el 60% de la nota final, mestres que la part de Pràctiques representa el 40% restant.

Les dates de les proves d'avaluació continuada i pràctiques es publicaran al campus virtual  al principi de curs i poden estar subjectes a possibles canvis de programació per motius d'adaptació a possibles incidències. Sempre s'informarà al campus virtual sobre aquests canvis, ja que s'entén que el CV és el mecanisme habitual d'intercanvi d'informació entre professor i estudiants.

Es concediran les matrícules d'honor resultants de calcular el cinc per cent o fracció dels alumnes matriculats en tots els grups de docència de l'assignatura. Només es podran atorgar a estudiants que hagin obtingut una qualificació final igual o superior a 9.

La forma com s'avaluarà cadascuna de les diferents parts de què consta l'assignatura (Teoria, Problemes i Pràctiques) es detalla a continuació: 

 

Teoria i Problemes

L’assignatura seguirà una metodologia d’avaluació contínua que permetrà anar descartant temari a mesura que l’estudiant avanci en el curs. Està prevista la realització de dues proves escrites d’avaluació contínua:

  • La primera prova (P1) es farà durant la setmana de parcials.
  • La segona prova (P2) es farà durant la setmana d’exàmens finals.

La dataexacta de les proves es publicarà a l’inici del cursi pot variar en funció de possibles incidències que puguin sorgirdurant el semestre. Sempre s'informarà al campus virtual sobre aquests canvis, ja que s'entén que el CV és el mecanisme habitual d'intercanvi d'informació entre professor i estudiants.


Cada prova tindrà un pes del 30% respecte de la nota final de l’assignatura.

Per poder realitzar la segona prova d’avaluació contínua (P2), caldrà que l’estudiant obtingui una nota mínima de 3,5 a la primera prova (P1). En cas contrari, haurà de fer l’examen de recuperació (ER), que inclourà preguntes de tot el contingut del curs. A més, si la mitjana entre les dues proves parcials (P1 i P2) és inferior a 5, l’estudiant també haurà de fer l’examen de recuperació per optar a aprovar l’assignatura.

Per a cada prova, s'indicarà lloc, data i hora de revisió en la qual l'estudiant podrà revisar l'activitat amb el professor. Si l'estudiant no es presenta a aquesta revisió, no es revisarà posteriorment aquesta activitat.

L’estudiant que vulgui assistir a la revisió haurà d’avisar, com a mínim, amb 24 hores d’antelació respecte de la data fixada, mitjançant un correu electrònic adreçat al seu professor de teoria. En cas de no avisar dins d’aquest termini, no es revisarà el seu examen.

Durant la sessió de revisió no s’explicaran ni es resoldran els exercicis de l’examen. Només es mostrarà l’examen perquè l’estudiant pugui identificar en quines parts ha fallat i entendre el motiu de la seva qualificació.

Les solucions dels exàmens no es publicaran al Campus Virtual. Si un estudiant vol conèixer lasolució de qualsevol exercici, haurà de sol·licitar una tutoria un cop finalitzat el procés de revisió.

 

Examen de recuperació

L’examen de recuperació el podrán fer únicament als estudiants que no hagin superat l’avaluació contínua, ja sigui perquè no han assolit la nota mínima de 5 punts sobre 10, o perquè no l’han seguit.

Aquest examen inclourà preguntes de tot el temari del curs i tindrà una puntuació màxima de 7 punts.  La nota mínima per fer mitjana amb la part pràctica és un 5. Obtenir una nota inferior a 5 comportarà suspendre l’assignatura.

Si es detecta qualsevol intent de còpia en qualsevol prova evaluable , tant durant la realització com en el procés de correcció, la nota final serà de 3 en l’expedient, i es procedirà a obrir un expedient disciplinari, que quedarà reflectit en el registre acadèmic de l’estudiant.

L’equip docent es reserva el dret de modificar el format de les proves parcials i finals segons consideri oportú, sense que aquestes hagin de ser similars a les d’anys anteriors.

 

Pràctiques de Laboratori

L'avaluació de les pràctiques es realitzarà a partir del desenvolupament del treball fet durant les sessions de laboratori i de les memòries redactades per a cadascuna de les sessions. Les pràctiques es desenvoluparan obligatòriament en grups de 3 estudiants.

L’assistència a les sessions pràctiques és obligatòria. No assistir a alguna sessió comportarà suspendre la part pràctica i, en conseqüència, l’assignatura. Encas d’incidència justificada, caldrà comunicar-ho prèviament al professor responsable i aportar un justificant oficial degudament signat dins el termini establert. Sempre s’haurà d’avisar abans de la sessió.

Cal aclarir que els viatgespersonals, així com els motius laborals, no es consideren incidències justificables, ja que l’estudiant disposa del calendari depràctiques des de l’inici del curs per evitar aquest tipus de situacions.

Les incidències puntuals justificables que no siguin per malaltia hauran de ser recuperades en un altre torn durant la mateixa setmana. Només estaran exempts de recuperació els estudiants que justifiquin una malaltia.

En qualsevol cas, el fet de no assistir al torn de pràctiques assignat i, per tant, impedir el treball conjunt amb el seu grup, comportarà que l’estudiant hagi de realitzar la pràctica de manera individual.

És obligatori estar present durant tota la sessió de pràctiques. Es passarà llista a l’inici de la sessió i, abans de marxar, el professor preguntarà als estudiants per la feina realitzada per tal de valorar el treball fet durant la sessió, moment en què tornarà a passar llista. El professor preguntarà a cada membre del grup per establir la nota individual de laboratori de la sessió. El percentatge de cada part de la pràctica es detallarà en la normativa específica de l’assignatura.

Totes les practiques tenen la mateixa puntuació. Les puntuacions específiques de cada pràctica es detallaran a l’enunciat corresponent. És responsabilitat de l’estudiant llegir-lo detingudament per conèixer les puntuacions assignades a cada apartat. Així mateix, també és responsabilitat de l’estudiant apuntar-se al llistat d’assistència de cada sessió.

Un retard superior a 15 minuts des de l’inici de la pràctica comportarà un “no presentat” a la sessió, sense possibilitat de recuperació. Aquesta condició no s’aplicarà als estudiants que puguin acreditar el retard amb un justificant oficial (per exemple, un certificat d’assistència mèdica).

Les pràctiques no són recuperables. Per aprovar aquesta part de l’assignatura, cal obtenir una nota mitjana mínima de 5. No s’estableix cap nota mínima per a les pràctiques individuals per poder calcular la mitjana global.

 

Plagi i còpies.

Sense perjudici d'altres mesures disciplinàries que es considerin oportunes, i d'acord amb la normativa acadèmica vigent, les irregularitats comeses per un estudiant que puguin conduir a una variació de la qualificació en una activitat avaluable es qualificaran amb un zero (0). Les activitats d'avaluació qualificades d'aquesta forma i per aquest procediment no seran recuperables. Si és necessari superar qualsevol d'aquestes activitats d'avaluació per aprovar l'assignatura, aquesta assignatura quedarà suspesa directament, sense oportunitat de recuperar-la en el mateix curs. Aquestes irregularitats inclouen, entre altres:

  • la còpia total o parcial d'una pràctica, informe, o qualsevol altra activitat d'avaluació; deixar copiar;
  • l'ús no autoritzat de la IA (p. ex., Copilot, ChatGPT o equivalents), etc. en qualsevol de les activitats d'avaluació implicarà suspendre-la amb un zero;
  • presentar un treball de grup no fet íntegrament pels membres del grup (aplicat a tots els membres, no només als que no han treballat);
  • presentar com a propis materials elaborats per untercer, encara que siguin traduccions o adaptacions, i en general treballs amb elements no originals i exclusius de l'estudiant;
  • tenir dispositius de comunicació (com telèfons mòbils, smart watches, bolígrafs ambcàmera, etc.) accessibles durant les proves d'avaluació teòric-pràctiques individuals (exàmens);
  • parlar amb companysdurant les proves d'avaluació teòric-pràctiques individuals (exàmens);
  • copiar o intentar copiar altres alumnes durant les proves d'avaluació teòric-pràctiques (exàmens);
  • utilitzar o intentar usar escrits relacionats amb la matèria durant la realització de les proves d'avaluació teòric-pràctiques (exàmens), quan aquests no hagin estat explícitament permesos.

En resum: copiar, deixar copiar o plagiar (o l'intent de) en qualsevol de les activitats d'avaluació equival a un SUSPENS, no compensable i sense convalidacions de parts de l'assignatura en cursos posteriors.

En cas de no superar l'assignatura pel fet que alguna de les activitats d'avaluació no arriba a la nota mínima requerida, la nota numèrica de l'expedient serà el valor menor entre 4.5 i la mitjana ponderada de les notes. Amb les excepcions que s'atorgarà la qualificació de "No Avaluable" als estudiants que no participin en cap de les activitats d'avaluació, i que la nota numèrica de l'expedient serà el valor menor entre 3.0 i la mitjana ponderada de les notes en cas que l'estudiant hagi comès irregularitats en un acte d'avaluació (i per tant no serà possible l'aprovat per compensació).


Bibliografia

Designing Data intensive applications - Martin Kleppmann, O'Reilly, 2017

The Data warehouse ETL toolkit - Ralph Kimball, Joe Caserta. Wiley, 2004

Spark, the definitive guide, Big data processing made simple. Bill Chambers and Matei Zaharia, O'Reilly, 2018

Learning Spark - Lightning fast data analysis - Holden Karau, Andi Konwinski, Patrick Wendell, Matei Zaharia, O'Reilly, 2015

Beginning Scala - Layka, Vishal. Apress; 2nd ed. 2015. 

Redis in Action - Josiah L. Carlson. Manning, 2013. 


Programari

S'utilitzaran els serveis al núvol proporcionats per l'Escola a la plataforma OpenNebula


Grups i idiomes de l'assignatura

La informació proporcionada és provisional fins al 30 de novembre de 2025. A partir d'aquesta data, podreu consultar l'idioma de cada grup a través d’aquest enllaç. Per accedir a la informació, caldrà introduir el CODI de l'assignatura

Nom Grup Idioma Semestre Torn
(PAUL) Pràctiques d'aula 711 Anglès primer quadrimestre tarda
(PLAB) Pràctiques de laboratori 711 Anglès primer quadrimestre tarda
(TE) Teoria 71 Anglès primer quadrimestre tarda