Logo UAB

Core Bioinformatics

Código: 42397 Créditos ECTS: 12
2024/2025
Titulación Tipo Curso
4313473 Bioinformática / Bioinformatics OB 0

Contacto

Nombre:
Sonia Casillas Viladerrams
Correo electrónico:
sonia.casillas@uab.cat

Equipo docente

Antoni Barbadilla Prados
Leonardo Pardo Carrasco
Pedro Puig Casado
Miquel Àngel Senar Rosell
Jean Didier Pierre Marechal
Jaime Luis Martinez Urtaza
Isaac Salazar Ciudad
Oscar Conchillo Solé
Marta Puig Font
(Externo) Emanuel Raineri
(Externo) Sebastián Ramos

Idiomas de los grupos

Puede consultar esta información al final del documento.


Prerrequisitos

Se recomienda un nivel B2 de inglés o equivalente.


Objetivos y contextualización

Este módulo se centra en el desarrollo de diversas herramientas y recursos bioinformáticos comúnmente utilizados en la investigación de las ómicas. Nuestra intención es que cubra varios aspectos de la bioinformática en una serie de temas breves, en forma de "catas". Por lo tanto, no es un módulo acumulativo, sino uno transversal, que debe proporcionar una amplia gama de ideas y enfoques que ofrece la bioinformática, de la mano de expertos. El objetivo principal es proporcionar a los estudiantes la base necesaria para aplicar la bioinformática a diferentes áreas de la investigación científica. Con el tiempo, cada estudiante podrá obtener toda la profundidad que se proponga sobre cualquiera de estos temas, el que finalmente represente su marco de investigación.


Competencias

  • Actuar en el ámbito de conocimiento propio evaluando las desigualdades por razón de sexo/género.
  • Analizar e interpretar bioinformáticamente los datos que se derivan de las tecnologías ómicas.
  • Comprender las bases moleculares y las técnicas experimentales estándares más comunes en las investigaciones ómicas (genómica, transcriptómica, proteómica, metabolómica, interactómica, etc.).
  • Diseñar y aplicar la metodología científica en la resolución de problemas.
  • Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • Proponer soluciones bioinformáticas a problemas derivados de las investigaciones ómicas.
  • Proponer soluciones innovadoras y emprendedoras en su campo de estudio.
  • Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
  • Utilizar sistemas operativos, programas y herramientas de uso común en bioinformática, así como, manejar plataformas de cómputo de altas prestaciones, lenguajes de programación y análisis bioinformáticos.
  • Utilizar y gestionar información bibliográfica y recursos informáticos en el ámbito de estudio.

Resultados de aprendizaje

  1. Actuar en el ámbito de conocimiento propio evaluando las desigualdades por razón de sexo/género.
  2. Buscar herramientas bioinformáticas específicas y recursos bioinformáticos en la red.
  3. Comprender las bases teóricas, estadísticas y biológicas, en las que se basan los programas de análisis bioinformático: alineamiento de secuencias, búsqueda por similitud y alineamiento múltiple, predicción de estructura, anotación de genomas, análisis filogenético y evolutivo.
  4. Crear y promover los algoritmos, las técnicas de cálculo y estadística y la teoría para resolver problemas formales y prácticos derivados de la gestión y el análisis de datos biológicos.
  5. Diseñar y aplicar la metodología científica en la resolución de problemas.
  6. Identificar y aplicar los algoritmos en los que se basan los programas de análisis bioinformático.
  7. Identificar y caracterizar los principales tipos de datos biomoleculares que se obtienen de las tecnologías ómicas.
  8. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  9. Proponer soluciones innovadoras y emprendedoras en su campo de estudio.
  10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
  11. Sintetizar e interpretar, de forma lógica y razonada, la información procedente de bases de datos moleculares y analizarla mediante herramientas bioinformáticas.
  12. Usar las principales bases de datos moleculares, los principales formatos estándares de datos moleculares e integrar datos de distintas fuentes de datos
  13. Utilizar y gestionar información bibliográfica y recursos informáticos en el ámbito de estudio.

Contenido

BLOQUE 1. ESTADÍSTICA

Inferencia estadística
Profesor Antonio Barbadilla

- Estadística: puente entre datos y modelos.
- Tipos de datos
- Población y muestra
- Diseño experimental
- Calidad de datos
- Exploración de datos
- Distribución de la muestra y ley de grandes números
- Inferencia estadística
- Teorema del límite central
- Estimación de puntos
- Estimación del intervalo de confianza
- Hipótesis
- Elementos de una prueba: H0, H1, prueba estadística, valor de p, nivel de significación, errores de tipo I y II, potencia
- Prueba Z, prueba t, prueba chi-cuadrada, prueba de correlación, regresión, análisis de varianza
- Interpretación de significación estadística
- Pruebas paramétricas versus no paramétricas
- Selección de la prueba estadística apropiada (árbol de decisión)
- Pruebas multivariadas
- Remuestreo

Estadística y procesos estocásticos para el análisis de secuencias.
Profesor Pere Puig

a. Fundamentos de probabilidad
Conjuntos y eventos. Propiedades La probabilidad condicional. Independencia. Alfabeto y secuencias. Modelos probabilísticos.

b. El modelo multinomial.
Simulando una secuencia multinomial. Estimación de probabilidades.

c. El paquete seqinr

d. Modelos de cadena de markov
Concepto y ejemplos. Clasificación de estados. Código r Simulando una secuencia de cadenas de Markov.Estimación de las probabilidades de transición. La probabilidad de una secuencia. Usando la cadena de Markov para la discriminación.

e. Cadenas de Markov de orden superior.
Concepto y ejemplos. Estimación de las probabilidades de transición. Comparación de las cadenas de Markov de orden superior.

f. Cadenas ocultas de Markov.
Concepto y ejemplos. Estimación de parámetros. Estimación de estados ocultos.

g. Una introducción a los modelos lineales generalizados.
Conceptos básicos de GLM. El modelo logístico. El modelo de Poisson.

Inferencia bayesiana
Profesor Emmanuele Raineri

1. Ajuste de la curva.
- Estimación de parámetros de distribuciones de probabilidad: binomial, poisson y gaussiana.
- Ejemplo: ajustar un conjunto de datos ruidoso.
- Validación cruzada, sobreajuste y regularización.

2. Reducción dimensional.
- Análisis de componentes principales, escalamiento multidimensional.
- Ejemplo: distinguir los tipos de células utilizando perfiles de metilación.

3. Regresión del lazo.
- Selección de variables en modelos lineales.
- Regresión penalizada: Lazo y Red Elástica.
- Ejemplo: regresión de lazo en R.

 

BLOQUE 2. UTILIDADES BÁSICAS

El genoma humano

Profesor Marta Puig

a. Introducción a los genomas.
Genomas secuenciados. Organización y tamaño de los genomas eucariotas. Construyendo un genoma: métodos NGS para genómica y transcriptómica.

b. El genoma humano: ¿dónde estamos ahora?
Ensamblaje actual del genoma humano. El proyecto ENCODE: elementos funcionales en el genoma humano.Contenido repetitivo del genoma humano.

Bases de datos y formatos de secuencia

Profesor Oscar Conchillo

a. Formatos de secuencia
Nomenclatura. Editores de texto. Formato FASTA y sus variantes. Formato sin formato / plano. Formato de secuenciade genbank. Formato de secuencia EMBL. GCG, NBRF / PIR, MSA, PHYLIP, NEXUS. Conversión de formato.

b. Bases dedatos
Concepto. Búsquedas booleanas. Los comodines y las expresiones regulares. Identificadores y números de acceso.Clasificación. Recopilación de bases de datos NAR. GenBank y otras bases de datos NCBI. EMBL. DDBJ. Meta-bases de datos integradas. Principales bases de datos de nucleótidos, proteínas, estructura, taxonomía, etc.

Ingeniería de software

Profesor Miquel Àngel Senar

a. Sistema de control de versiones con Git y GitHub.
b. Estrategias de paralelización y HPC.
c. Computación en la nube con Amazon Web Services

 

BLOQUE 3. BIOINFORMÁTICA ESTRUCTURAL

Estructura proteica

Profesores Leonardo Pardo y Óscar Conchillo

a. Introducción
Aminoácidos, proteínas y enlaces peptídicos. Cuatro niveles de estructura proteica. Plegamiento y estabilidad de proteínas. Interacciones moleculares. Métodos experimentales para la determinación de la estructura.

b. Motivos y dominios.

c. Análisis
Bases de datos UNIPROT, PDB, PFAM, CATH y SCOP. Alineamiento de proteínas, morphing, superficies moleculares, potencial electrostático molecular.

d. Membrana celular
Proteínas de membrana, segmentos transmembrana.

Modelado molecular

ProfesoresLeonardo Pardo y Jean-Didier Maréchal

a. Modelado por homología

b. Modelado molecular
Modelos atómicos. Energía potencial. Mecánica cuántica y molecular. Técnicas de exploración conformacional.

 

BLOQUE 4. GENÓMICA

Introducción: Genomas y datos ómicos

Profesor Jaime Martínez Urtaza

a. Principales hitos del proyecto de secuenciación del genoma: secuenciación, ensamblaje y anotación.

b. Secuenciación. Secuenciación clásica por el método de Sanger. Técnicas de secuenciación de próxima generación (NGS). Técnicas de segunda generación: 454/Roche (pirosecuenciación), Illumina (terminación reversible), SOLiD (secuenciación por ligación), Ion Torrent (detección de protones). Técnicas de tercera generación. Desafíos y diferencias con las técnicas de segunda generación. Pacific Biosciences (PacBio; Molécula Única en Tiempo Real, SMART). Oxford Nanopore (Minion).

c. Ensamblaje. Ensamblaje de novo versus mapeo contra referencia. Lecturas y contigs. Medida de la calidad de un ensamblaje: calidad deuna base o puntuación Phred (Q), redundancia (cobertura), N50 y L50. Lecturas apareadas y scaffolds.

Genómica de poblaciones

Profesor Isaac Salazar

a. Genómica poblacional bajo neutralidad en una población finita.
Introducción. Deriva genética. Tamaño efectivo de la población. Probabilidad de fijación de mutaciones neutras.

b. Genómica de poblaciones bajo selección.
Seleccion natural. Probabilidad de fijación de mutaciones seleccionadas. Distribución de fitness de nuevas mutaciones. Tasa de evolución.

c. Evolución adaptativa y tamaño de la población.

Filogenia y evolución molecular
Profesor Sebastián Ramos

a. Modelos de evolución de secuencias.
Secuencia deADN Modelo de Jukes y Cantor. Modelos más realistas. Selección delmodelo.

b. Filogenia
Concepto. Árboles de especies versus árboles degenes. Métodos de reconstrucción de árboles: métodos de distancia, parsimonia máxima, probabilidad máxima, inferencia bayesiana. Apoyo. Filogenómica. Construyendo árboles con R.

Biología de sistemas

Profesor Isaac Salazar

a. Biología de sistemas de la edad clásica y genómica.
El paradigma de la biología de sistemas a la luz de los desarrollos tecnológicos de los últimos 100 años. Cuellos de botella en la integración de datos.

b. Modelización matemática de circuitos moleculares.
Modelos conceptuales. Desde modelos conceptuales hasta modelos matemáticos. Formalismos matemáticos.Modelos basados en datos.

c. Principios de diseño y organización en circuitos moleculares.
Concepto de principiodediseño. Comparaciones controladas matemáticamente. Análisis de viabilidad. Espacios de diseño. Biología sintética.


Actividades formativas y Metodología

Título Horas ECTS Resultados de aprendizaje
Tipo: Dirigidas      
Clases teóricas 39 1,56 4, 5, 6, 7, 8, 9, 2, 10, 11, 3, 13, 12
Resolución de problemas en clase y tareas en el laboratorio biocomputacional 39 1,56 4, 5, 6, 7, 8, 9, 2, 10, 11, 3, 13, 12
Tipo: Supervisadas      
Realización de trabajos individuales y en grupo 40 1,6 4, 5, 6, 7, 8, 9, 2, 10, 11, 3, 13, 12
Tipo: Autónomas      
Estudio autónomo individual 178 7,12 4, 5, 6, 7, 8, 9, 2, 10, 11, 3, 13, 12

La metodología combinará clases magistrales, resolución de problemas prácticos y casos reales, trabajo en el laboratorio de computación, trabajo individual y en equipo, lectura de artículos relacionados con los bloques temáticos y autoestudio independiente. Se utilizará la plataforma virtual.

 

Nota: se reservarán 15 minutos de una clase dentro del calendario establecido por el centro o por la titulación para que el alumnado rellene las encuestas de evaluación de la actuación del profesorado y de evaluación de la asignatura o módulo.


Evaluación

Actividades de evaluación continuada

Título Peso Horas ECTS Resultados de aprendizaje
Habilidades blandas 10% 0 0 1, 5, 8, 9, 10
Portafolio del estudiante 55% 0 0 4, 5, 6, 7, 8, 9, 2, 10, 11, 3, 13, 12
Test teórico y práctico individual 35% 4 0,16 4, 5, 6, 7, 8, 9, 2, 10, 11, 3, 13, 12

El sistema de evaluación está organizado en tres actividades principales. Habrá, además, un examen de recuperación. Los detalles de las actividades son:

Actividades de evaluación principales

  • Portafolio del estudiante (55%): trabajo hecho y presentado por el alumnado a lo largo del curso. Ninguna de las actividades de evaluación individuales representará más del 50% de la nota final.
  • Prueba teórica y práctica individual (35%): habrá un examen al final de este módulo. Consistirá en una o dos cuestiones de selección múltiple o de respuesta corta por parte del profesorado del módulo.
  • Habilidades blandas (10%): asistencia, puntualidad y participación activa en clase.

Examen de recuperación

Para poder participar en el proceso de recuperación, el alumnado deberá previamente haber participado en como mínimo el equivalente a dos tercios de la nota final del módulo en actividades de evaluación. El profesorado informará de los procedimientos y plazos para el proceso de recuperación. Nótese que las habilidades blandas no pueden recuperarse.

No evaluable

El alumnado será calificado como “No evaluable” cuando el peso de la evaluación en la que ha participado sea inferior al equivalente al 67% de la nota final del módulo.

Evaluación única

Esta asignatura/módulo no contempla el sistema de evaluación única.

 

Bibliografía

El profesorado recomendará la bibliografía actualizada en cada sesión de este módulo, y los enlaces se pondrán a disposición en el Área del Estudiante del sitio web oficial de MSc Bioinformatics.


Software

El profesor recomendará el software actualizado en cada sesión de este módulo, y los enlaces se pondrán a disposición en el Área del Estudiante del sitio web oficial de MSc Bioinformatics.


Lista de idiomas

Nombre Grupo Idioma Semestre Turno
(PLABm) Prácticas de laboratorio (máster) 1 Inglés primer cuatrimestre manaña-mixto
(TEm) Teoría (máster) 1 Inglés primer cuatrimestre manaña-mixto