Logo UAB

Anàlisi Exploratòria de Dades

Codi: 104853 Crèdits: 6
2024/2025
Titulació Tipus Curs
2503852 Estadística Aplicada FB 1

Professor/a de contacte

Nom:
Maria Rosa Camps Camprubi
Correu electrònic:
rosa.camps@uab.cat

Equip docent

Montserrat Ferre Delgado

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

Coneixements estàndard de Batxillerat.


Objectius

L'objectiu d'aquest curs és, en primer lloc, el coneixement de les tècniques descriptives i exploratòries aplicades a resumir la informació continguda en els conjunts de dades experimentals. Es comença amb l'estudi d'una variable, i seguidament s'inicia l'estudi comparatiu de dues o més variables. Es dediquen apartats especials a l'estudi de l'evolució temporals de les variables: sèries cronològiques i nombres índex. Un objectiu paral·lel, tant o més important, és la interpretació dels resultats i de les gràfiques en el context de les dades. Finalment, en aquesta assignatura s'aprèn el llenguatge i programari lliure R, de manipulació i anàlisi de dades, el qual s'utilitzarà al llarg del grau.


Resultats d'aprenentatge

  1. CM05 (Competència) Interpretar situacions basades en conjunts de dades, representacions gràfiques i resums estadístics.
  2. CM06 (Competència) Aplicar els coneixements adquirits per a organitzar dades, construir i mostrar taules i treballar amb diferents representacions de dades.
  3. KM07 (Coneixement) Identificar patrons de comportament en l'exploració de dades.

Continguts

1. Preliminars

1.1. Objectiu de l'anàlisi exploratòria de dades.
1.2. Tipus de variables i escales de mesura.
1.3. Arrodoniments i notació científica.

2. Resum de dades estadístiques.

2.1. Distribucions de freqüències: taules.
2.2. Agrupament en intervals.
2.3. Representacions gràfiques.

3. Característiques numèriques d'una variable.

3.1. Característiques de posició central: mitjana, mediana, moda.
3.2. Altres característiques de posició: quartils, decils i percentils.
3.3. Característiques de dispersió: variància i desviació típica (mostrals i poblacionals), rang, rang inter-quartil.
3.4. Característiques de dispersió relativa.
3.5. Puntuacions tipificades.
3.6. Característiques de forma: simetria i curtosi.

4. Complements en l'estudi d'una variable.

4.1. Anàlisi exploratòria: diagrama de caixa i altres gràfics.
4.2. Transformació de variables.
4.3. Altres mitjanes: geomètrica, harmònica, quadràtica.
4.4. La desigualtat de Txebixev.

5. Comparació d'una variable en dos o més grups: Anàlisi exploratòria.

5.1. Situació de mostres independents.
5.2. Situació de mostres aparellades

6. Tabulació i representació de la distribució conjunta dels valors de dues variables categòriques.

6.1. Taules de contingència (distribucions de freqüències conjunta, marginals i condicionades).
6.2. Anàlisi descriptiu de la dependència entre dues variables categòriques.

7. Descripció numèrica de la distribució conjunta de dues variables estadístiques.

7.1. Característiques marginals i condicionades.
7.2. Corbes de regressió i coeficient de correlació.
7.3. Ajustament lineal i predicció.

8. Introducció a les sèries temporals.

8.1. La descomposició clàssica.

 

 


Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Classes de problemes 8 0,32
Classes de teoria 18 0,72
Estudiar conceptes de teoria, resolver problemes a mà i amb R 84 3,36
Pràctiques amb ordinador 30 1,2

El treball d'aula, teoria i problemes, es complementarà amb pràctiques d'ordinador on s'utilitzarà el paquet estadístic R.

Al campus virtual els alumnes hi trobaran la planificació de l'assignatura, les llistes de problemes i les pràctiques, així com eventuals canvis d'aula, horaris, etc.

És important tenir en compte que el Campus Virtual no és una web estàtica sinó que s'anirà actualitzant al llarg del curs.

Es procurarà introduir a la part més pràctica de l'assignatura, l'anàlisi i comparació de dades estadístiques per sexe, comentant, si s'escau, a l'aula les causes i els mecanismes socials i culturals que poden sustentar les desigualtats observades.

 

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, per a la complementació per part de l'alumnat de les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura/mòdul.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Lliuraments d'exercicis realitzats amb ordinador 15% 2 0,08 CM05, CM06, KM07
Primer parcial de teoria i problemes 20% 2 0,08
Primera prova de resolució de problemes amb ordinador 15% 2 0,08 CM05, CM06, KM07
Segon parcial de teoria i problemes 25% 2 0,08
Segona prova de resolució de problemes amb ordinador 25% 2 0,08

La nota final de l'assignatura F s'obtindrà a partir de:

1) Les notes dels dos exàmens parcials de teoria i problemes, TP1 i TP2, amb pesos respectius 20% i 25%.

2) Les notes de les dues proves amb ordinador, O1 i O2, amb pesos respectius 15% i 25%.

3) L'assistència a les sessions pràctiques amb ordinador i la nota dels lliuraments que es proposin, PC, amb un pes del 15%. Aquesta part no és recuperable.

La nota final de l'assignatura s'obté fent la mitjana ponderada F= 0,2 TP1 + 0,15 O1+ 0,25 TP2 + 0,25 O2 +0,15 PC.

Requisit per superar l'assignatura amb la mitjana anterior, les notes TP1, TP2 i O2 han de ser majors o iguals a 4 i O1 ha de ser major o igual que 3,5.

 

Hi haurà dues proves de síntesi per als estudiants que no aprovin l'assignatura amb la fórmula anterior (F<5) o no compleixin els requisits mencionats (almenys 4 en O2, TP1, TP2 i almenys 3,5 en O1):

- Una prova de síntesi STP de tot el temari de teoria i problemes, per als estudiants que tinguin alguna de les notes TP1 o TP2 amb menys de 4 o suspenguin l'assignatura a causa de teoria i problemes.

- Una prova de síntesi SO de totes les pràctiques, per a aquells estudiants que tinguin menys de 3,5 en O1 i/o menys de 4 en O2 o bé suspenguin l'assignatura a causa de les pràctiques.

La seva nota final serà F=0,45 STP + 0,40 SO + 0,15 PC

(en cas que només els calgui presentar-se a una de les dues proves de síntesi se substituirà la nota de l'examen de síntesi per la mitjana ponderada dels dos parcials ja aprovats).

 

Després de les segones proves parcials s'atorgaran les matrícules d'honor que es considerin clares. Aquestes matrícules seran ja definitives. Si el nombre màxim de matrícules permès no s'ha assolit, es reconsiderarà la possibilitat d'atorgar-ne més després de l'examen de recuperació.

Si un estudiant no es presenta a cap parcial ni a la prova de síntesi,es qualificarà com a "No Avaluable".

Sense perjudici d'altres mesures disciplinàries que s'estimin oportunes, i d'acord amb la normativa acadèmica vigent, es qualificaran amb un zero les irregularitats comeses per l'estudiant que puguin conduir a una variació de la qualificació d'un acte d'avaluació. Per tant, plagiar, copiar o deixar copiar una pràctica o qualsevol altra activitat d'avaluació implicarà suspendre-la amb un zero i no es podrà recuperar en el mateix curs acadèmic. Si aquesta activitat té una nota mínima associada, aleshores l'assignatura quedarà suspesa. Un sol lliurament copiat implica, en el millor dels casos, un zero de la nota PC.

L’alumnat que s’hagi acollit a la modalitat d’avaluació única haurà de realitzar dos exàmens globals de l'assignatura: una prova de teoria i de problemes i una altra prova amb ordinador. Aquests dos exàmens es faran el mateix dia i hora que els corresponents al segon parcial de l'assignatura. Aquell dia l'estudiant podrà entregar els exercicis dels lliuraments de pràctiques que s'hagin programat al llarg del curs, l'enunciat dels quals trobarà al Moodle. La ponderació per a la nota final serà de 45% en l'examen de teoria i problemes, 40% en el d'ordinador i 15% dels lliuraments. L'estudiant podrà ser convocat posteriorment a unarevisió oral dels exàmens idels lliuraments amb les professores de l'assignatura. Si s'obté una nota inferior a 5, es podrà recuperar el mateix dia, hora i lloc que es realitzi la recuperació de la resta d'alumnes del curs. Les ponderacions seran les mateixes.
 

 


Bibliografia

Manual de teoria

X. BARDINA, M. FARRÉ, Estadística descriptiva, Manuals, 54 Servei de Publicacions, UAB

Bibliografia:

A.J.B. ANDERSON, Interpreting Data. A first cours in Statistics, Ed Chapman and Hall, 1989.
E. CASA ARUTA, Problemas de Estadística Descriptiva, Ed. Vicens Vives.
R. JOHNSON, P. KUBY, Estadística elemental: Lo esencial, Ed Thomson, 1999.
B. PY, Statistique Descriptive, Ed Económica, 1988.
R. SAFRIAN, Introduction to Data Science, https://bookdown.org/ronsarafian/IntrotoDS/
M. SPIEGEL, Estadística, Teoría y 875 problemas resueltos, Schaum-McGraw-Hill, 1990.
V. ZAIATS, M.L. CALLE i R. PRESAS, Probabilitat i Estadística. Exercicis I, Eumo Ed, 1998.
H. WICKHAM i G. GROLEMUND, R for Data Science, traducció a l'espanyol a  https://es.r4ds.hadley.nz/
R Tutorial. An R introduction to statistics.  (2016).  www.r-tutor.com

Bibliografia complementària.

V. COLL SERRANO, Introducción al Análisis Exploratorio de Datos. Aplicaciones con R y datos reales. Universitat de València. Introducción al Análisis Exploratorio de Datos. Aplicaciones con R y datos reales
G. CALOT, Curso de Estadística Descriptiva. Ed Paraninfo, 1988.
FERNÁNDEZ, J.M. CORDERO, A. C\'ORDOBA, Estadística Descriptiva, ed ESIC 1996.
L.C HAMMILTON, Modern Data Analysis, Brooks/Cole Publishing Company, 1990.
P.G. HOEL i R.J. JESSEN, Estadística básica para negocios y economía, Compañía Editorial Continental,Mexico, 1993.
R.K. PEARSON, Exploratory Data Analysis using R. Data Mining and Knowledge Discovery Series, Chapman & Hall/CRC, 2018.
D. PEÑA SÁNCHEZ DE RIVERA, Estadística. Modelos y métodos. 1. Fundamentos i 2. Modelos lineales yseries temporales, Alianza Editorial 1995. (2 volums)
I. SOLER RAMOS i J. TORRENT SELLENS, Tècniques d'anàlisi de dades per a l'empresa, setembre 2011, Open Access UOC. http://hdl.handle.net/10609/55081


Programari

R i RStudio, amb paquets bàsics i Tidyverse.


Llista d'idiomes

Nom Grup Idioma Semestre Torn
(PLAB) Pràctiques de laboratori 1 Català primer quadrimestre tarda
(PLAB) Pràctiques de laboratori 2 Català primer quadrimestre tarda
(TE) Teoria 1 Català primer quadrimestre tarda