Aquesta versió de la guia docent és provisional fins que no finalitzi el període d’edició de les guies del nou curs.

Logo UAB

Tractament i Anàlisi de Dades Lingüístiques

Codi: 45505 Crèdits: 5
2025/2026
Titulació Tipus Curs
Estudis Avançats de Llengua i Literatura Catalanes OP 1

Professor/a de contacte

Nom:
Gemma Repiso Puigdelliura
Correu electrònic:
gemma.repiso@uab.cat

Equip docent

(Extern) Josefina Carrera-Sabaté

Idiomes dels grups

Podeu consultar aquesta informació al final del document.


Prerequisits

No hi ha prerequisits.


Objectius

L’assignatura té com a finalitat principal proporcionar a l’estudiant les eines metodològiques necessàries per dur a terme una recerca rigorosa en l’àmbit de la lingüística, amb un èmfasi especial en l’estudi de la variació lingüística centrada en el component fònic de la llengua. Es proporcionaran coneixements sobre el cicle complet d’una investigació lingüística emmarcada en la sociolingüística de la variació : des de la definició de l’objecte d’estudi i la recollida de dades, passant per l’observació qualitativa i quantitativa fins a l’anàlisi estadística i la formalització dels resultats. Es proporcionaran coneixements sobre el programari R, que s’utilitzarà com a eina principal per al tractament, l’organització i la visualització de dades lingüístiques, així com per a l’aplicació de tècniques estadístiques descriptives i inferencials que permetin extreure conclusions a partir de dades empíriques.

L’estudiant haurà de ser capaç de:

  • Identificar i descriure fenòmens de variació lingüística.
  • Aplicar mètodes de recerca quantitatius i qualitatius en l’anàlisi de dades lingüístiques.
  • Utilitzar eines de tractament de dades, especialment el programari R, per a la manipulació i visualització de dades lingüístiques.
  • Formular hipòtesis, realitzar contrastos estadístics, analitzar resultats i extreure conclusions significatives a partir de dades empíriques.
  • Presentar una proposta de recerca i un informe d’anàlisi de dades amb estructura científica i claredat expositiva.

 


Resultats d'aprenentatge

  1. CA23 (Competència) Aplicar els coneixements, mètodes i eines de recollida i tractament de dades per a la creació de corpus lingüístics.
  2. CA23 (Competència) Aplicar els coneixements, mètodes i eines de recollida i tractament de dades per a la creació de corpus lingüístics.
  3. CA24 (Competència) Examinar el disseny d'una recerca lingüística, els processos de selecció d'informants i les tècniques de recollida de dades lingüístiques seguint els principis de l'ètica investigadora.
  4. CA24 (Competència) Examinar el disseny d'una recerca lingüística, els processos de selecció d'informants i les tècniques de recollida de dades lingüístiques seguint els principis de l'ètica investigadora.
  5. KA30 (Coneixement) Identificar les fases de la recollida, tractament, anàlisi, formalització i presentació de dades lingüístiques en un estudi sobre la llengua catalana.
  6. KA31 (Coneixement) Reconèixer les diverses metodologies específiques per a la recollida de dades lingüístiques en un estudi sobre la llengua catalana.
  7. KA31 (Coneixement) Reconèixer les diverses metodologies específiques per a la recollida de dades lingüístiques en un estudi sobre la llengua catalana.
  8. KA32 (Coneixement) Seleccionar les eines tecnològiques adequades per a la gestió de corpus lingüístics en un estudi sobre la llengua catalana.
  9. SA31 (Habilitat) Fer anàlisis estadístiques i interpretatives de diferents tipologies sobre dades lingüístiques de la llengua catalana en un estudi.
  10. SA32 (Habilitat) Analitzar dades lingüístiques de la llengua catalana amb l'ajut de programes informàtics específics.
  11. SA33 (Habilitat) Explotar fonts primàries lingüístiques amb instruments digitals.
  12. SA33 (Habilitat) Explotar fonts primàries lingüístiques amb instruments digitals.

Continguts

Els continguts es divideixen en dues àrees interrelacionades: els fonaments de la recerca en variació lingüística i les eines per al tractament estadístic de dades lingüístiques.

Bloc 1: Fonaments per analitzar la variació d’una llengua

  1. Bases per analitzar la variació interna d’una llengua. Producció, percepció i subjectivitat dels parlants
  2. Preparació i execució d’un projecte d’investigació: plantejament de la investigació, marc conceptual, formulació d’hipòtesis (preguntes de recerca) i objectius, utilitat de la recerca, determinació del disseny metodològic, cronograma
  3. Disseny metodològic: ubicació del treball, mostra, tècniques de recollida de dades i anàlisi de dades (qualitatives i quantitatives).
  4. Introducció a l’estadística: definició de variables, tipus i naturalesa de les variables, estadística descriptiva i inferencial, significació estadística,.

 

Bloc 2: Tractament de dades lingüístiques amb eines estadístiques

  1. Introducció a R: Preparació de dades: neteja, transformació i codificació de variables lingüístiques.
  1. Estadística descriptiva: Resum i visualització de dades: taules, gràfics i mesures de tendència central i dispersió.
  2. Contrastació d’hipòtesis i tests paramètrics: disseny de proves estadístiques per a la variació lingüística.
  1. Mostreig de distribucions, estadística de mostres i paràmetres de població

Activitats formatives i Metodologia

Títol Hores ECTS Resultats d'aprenentatge
Tipus: Dirigides      
Assistència a les classes i a les activitats programades 24 0,96 CA23, CA24, KA30, KA31, KA32, SA31, SA32, SA33
Elaboració de treballs i d'activitats a casa 91 3,64 CA23, SA31, SA32, SA33

L’assignatura combina sessions teòriques amb activitats pràctiques i aplicades. Els continguts teòrics es complementaran amb exercicis a l’aula, la manipulació de dades reals i la realització de pràctiques amb programari estadístic. Els estudiants desenvoluparan una proposta de recerca que integrarà els coneixements adquirits al llarg del curs i un informe de resultats realitzat amb el programari R.

Nota: es reservaran 15 minuts d'una classe, dins del calendari establert pel centre/titulació, perquè els alumnes completin les enquestes d'avaluació de l'actuació del professorat i d'avaluació de l'assignatura.


Avaluació

Activitats d'avaluació continuada

Títol Pes Hores ECTS Resultats d'aprenentatge
Exercici anàlisi estadística 40% 3,75 0,15 KA32, SA31, SA32, SA33
Exercicis pràctics 20% 2,5 0,1 CA23, KA31, KA32, SA31, SA32, SA33
Proposta d'un projecte d'investigació 40% 3,75 0,15 CA24, KA30, KA31

  • Exercicis pràctics a l’aula (20%): Es valorarà la realització regular i la qualitat dels exercicis pràctics proposats durant les sessions. Aquests exercicis estaran orientats al desenvolupament de competències metodològiques i tècniques relacionades amb l’anàlisi de dades lingüístiques i l’ús del programari R. També s’avaluarà la participació activa i l’aprofitament de les activitats.

    Proposta d’un projecte de recerca (40%): Els estudiants hauran d’elaborar una proposta formal de projecte d’investigació en l’àmbit de la variació lingüística. 

  • Exercici d’anàlisi estadística (40%): L’estudiant haurà d’entregar un exercici final que consisteixi en l’anàlisi estadística d’un conjunt de dades lingüístiques utilitzant R. Aquest informe haurà d’incloure el tractament de les dades, l’aplicació de tècniques estadístiques adequades, la interpretació dels resultats i la presentació clara i estructurada de les conclusions. Es tindrà en compte tant la correcció tècnica com la capacitat d’argumentació i exposició.


Bibliografia

Butler, Christopher S. (1985). Statistics in Linguistics. Oxford, Basil Blackwell

Gries, S. T. (2013). Statistics for linguistics with R: A practical introduction. Walter de Gruyter.

Labov, W. (2010) Principles of Linguistic Change. Vol 3: Cognitive and Cultural Factors. Malden/Oxford: Wiley-Blackwell.

Moreno-Fernández, F. (2012) Sociolingüística cognitiva. Proposiciones, escolios y debates. Madrid/Frankfurt: Iberoamericana/Vervuert.

Pradilla, M. À. (2008). Sociolingüística de la variació i llengua catalana. Barcelona: Institut d’Estudis Catalans

Sonderegger, M. (2023). Regression modeling for linguistic data. MIT Press.

Strelluf, C. (ed.) (2023) The Routledge Handbook of Sociophonetics. Londres: Routledge.

Tagliamonte, S. (2012) Variationist Sociolinguistics. Change, Observation, Interpretation. Malden/Oxford: Wiley-Blackwell

Tatham, M.; Morton, K. (2011). A guide to Speech Production and Perception. Edinburgh University Press: Edimburg.

Verzani, John. (2005). Using R for introductory statistics. Boca Raton: Chapman & Hall.

Vida-Castro, M.; Ávila-Muñoz, A. M. (eds.) (2024) The Continuity of Linguistic Change: Selected Papers in Honour of Juan Andreìs Villena-Ponsoda. Amsterdam/Philadelphia: John Benjamins Publishing Company.

Winter, B. (2019). Statistics for linguists: An introduction using R. Routledge.


Programari

R Core Team. (2024). R: A language and environment for statistical computing (Version 4.x.x) [Computer software]. R Foundation for Statistical Computing. https://www.R-project.org/


Grups i idiomes de l'assignatura

La informació proporcionada és provisional fins al 30 de novembre de 2025. A partir d'aquesta data, podreu consultar l'idioma de cada grup a través d’aquest enllaç. Per accedir a la informació, caldrà introduir el CODI de l'assignatura

Nom Grup Idioma Semestre Torn
(TEm) Teoria (màster) 1 Català segon quadrimestre tarda