Disciplina - detalhe

LGN5835 - Bioinformática Aplicada


Carga Horária

Teórica
por semana
Prática
por semana
Créditos
Duração
Total
2
2
8
15 semanas
120 horas

Docentes responsáveis
Luiz Eduardo Vieira Del Bem

Objetivo
A disciplina oferecerá aos alunos uma visão teórico-prática dos principais métodos e ferramentas em bioinformática moderna, abordando desde a comparação de sequências primárias até análises estruturais e genômicas em larga escala. Busca capacitar os estudantes a aplicar técnicas de alinhamento, filogenia, análise de genomas, pangenômica, transcriptômica e visualização estatística de dados biológicos, com ênfase no uso de softwares amplamente utilizados na área.

Conteúdo
Bioinformática básica e avançada. Comparação de sequências de DNA e proteínas: BLAST, HMMER, alinhamentos múltiplos e estimação de distâncias genéticas. Filogenia por métodos de distância, máxima verossimilhança e inferência bayesiana. Redes de similaridade. Comparação de genomas, colinearidade e sintenia. Predição e comparação de estruturas tridimensionais de proteínas. Construção de bibliotecas, sequenciamento e análise de DNA em larga escala. Conceitos e metodologias em pangenômica. Construção de bibliotecas e análise de dados de RNA-seq. Métodos estatísticos para dados genômicos e transcriptômicos; visualização e manipulação de dados com R e Bioconductor. Principais programas utilizados incluem: BLAST, HMMER, MAFFT, IQ-TREE, RAxML, MrBayes, OrthoFinder, MCScanX, AlphaFold, BUSCO, FastQC, Trinity, DESeq2, R, Bioconductor.

Bibliografia
Altschul, S.F.; Gish, W.; Miller, W.; Myers, E.W.; Lipman, D.J. Basic Local Alignment Search Tool. Journal of Molecular Biology, 215:403–410, 1990.
Eddy, S.R. Profile hidden Markov models. Bioinformatics, 14:755–763, 1998.
Sievers, F. et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Molecular Systems Biology, 7:539, 2011.
Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution, 17:368–376, 1981.
Ronquist, F. et al. MrBayes 3.2: Efficient Bayesian phylogenetic inference and model choice. Systematic Biology, 61:539–542, 2012.
Nguyen, L.-T. et al. IQ-TREE: A fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Molecular Biology and Evolution, 32:268–274, 2015.
Wang, Y. et al. MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity. Nucleic Acids Research, 40:e49, 2012.
Vernikos, G.; Medini, D.; Riley, D.R.; Tettelin, H. Ten years of pan-genome analyses. Nature Reviews Genetics, 16:62–72, 2015.
Treangen, T.J.; Salzberg, S.L. Repetitive DNA and next-generation sequencing: computational challenges and solutions. Nature Reviews Genetics, 13:36–46, 2012.
Jumper, J. et al. Highly accurate protein structure prediction with AlphaFold. Nature, 596:583–589, 2021.
Holm, L. DALI and the persistence of protein shape. Protein Science, 29:128–140, 2020.
Mardis, E.R. Next-generation sequencing methods. Annual Review of Genomics and Human Genetics, 9:387–402, 2008.
Goodwin, S.; McPherson, J.D.; McCombie, W.R. Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics, 17:333–351, 2016.
Wang, Z.; Gerstein, M.; Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature Reviews Genetics, 10:57–63, 2009.
Love, M.I.; Huber, W.; Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology, 15:550, 2014.
Robinson, M.D.; McCarthy, D.J.; Smyth, G.K. edgeR: a Bioconductor package for differential expression analysis. Bioinformatics, 26:139–140, 2009.
Gentleman, R.C. et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology, 5:R80, 2004.