Carga Horária
Teórica por semana |
Prática por semana |
Créditos |
Duração |
Total |
3 |
1 |
6 |
15 semanas |
90 horas |
Docentes responsáveis
Idemauro Antonio Rodrigues de Lara
Rafael de Andrade Moral
Objetivo
Capacitar os estudantes quanto às técnicas para análise de dados categorizados. Apresentar modelos
teóricos e técnicas exploratórias. Identificar e aplicar métodos de análise em situações práticas das
ciências agrárias.
Conteúdo
Ementa: Estudo de métodos e técnicas para a análise de dados categorizados: fundamentação teórica
e prática com uso de recursos computacionais.
Conteúdo programático:
1. Estudos motivacionais e fundamentação teórica
1.1. Dados categorizados em situações práticas. Escalas de mensuração de variáveis. Notação.
1.2. Distribuições probabilísticas: binomial, Poisson, binomial negativa, hipergeométrica,
multinomial, hipergeométrica-multinomial, Dirichlet-multinomial, multinomial negativa.
1.3. Delineamentos experimentais e amostrais: planejamentos de estudos prospectivos,
retrospectivos, transversais, longitudinais. Esquemas de amostragem e distribuições probabilísticas.
2. Análise exploratória para dados categorizados
2.1. Tabelas de contingência. Notação e representação em estudos com covariáveis categorizadas.
2.2. Representação gráfica para dados categorizados. Gráficos de correspondência para estudos
com covariáveis. Gráficos de perfis para estudos longitudinais.
3. Inferência para tabelas de contingência
3.1. Estimadores de máxima verossimilhança para proporções conjuntas, marginais e condicionais. Estimação intervalar. Medidas de associação.
3.2. Testes de hipóteses para independência e homogeneidade. Estatística da razão de verossimilhanças. Teste de independência para dados ordinais.
3.3. Estimação de medidas de incidência, prevalência, risco relativo e razão de chances em tabelas 2 x 2. Teste exato de Fisher. Extensões para tabelas com maior dimensão. Métodos de Cochran-Mantel-Haenszel.
4. Extensões dos modelos lineares generalizados
4.1. Respostas politômicas e família exponencial mutivariada.
4.2. Modelo dos logitos generalizados para respostas nominais. Estimação e seleção de modelos.
4.3. Modelos para respostas ordinais: logitos cumulativos e de chances proporcionais. Teste de razão de verossimilhanças para proporcionalidade. Seleção de modelos.
5. Tópicos especiais
5.1. Análise de resíduos e diagnósticos para modelos com respostas politômicas.
5.2. Análise de dados categorizados longitudinais. Introdução às classes de modelos marginais, de transição e mistos.
Bibliografia
Agresti, A. Analysis of Ordinal Categorical Data, 2nd ed. New York: Wiley, 2010.
Agresti, A. Categorical Data Analysis, 3rd ed. New York: Wiley, 2012.
Christensen,R. H. Analysis of ordinal data with cumulative link models estimation with the R-package ordinal. 2011. Available in http://www.R-project.org.
Croissant, Y. Multinomial Logit Model. 2013. Disponível em: http://www.r-project.org.
Diggle, P.J.; Heagerty, P.J.; Liang, K.Y.; Zeger, S.L. Analysis of longitudinal data. New York: Oxford University Press, 2002.
Fatoretto M.B., de Lara I.A.R., Loro A.C., Spoto M.H.F. Sensory evaluation of dehydrated tomatoes using the proportional odds mixed model. J Food Process Preserv. 2018;e13822. https://doi.org/10.1111/jfpp.13822
I. A. R. de Lara, J. P. Hinde, A. C. de Castro & I. J. O. da Silva (2017). A proportional odds transition model for ordinal responses with an application to pig behaviour, Journal of Applied Statistics, 44:6, 1031-1046, DOI: 10.1080/02664763.2016.1191623
Idemauro Antonio Rodrigues de Lara, John Hinde & Cesar Augusto Taconeli (2018): Global and local tests to assess stationarity of Markov transition models, Communications in Statistics - Simulation and Computation, DOI: 10.1080/03610918.2017.1406504
Lipsitz, S.R.; K.Kim; L. Zhao. Analysis of repeated categorical data using generalized estimating equations. Statistics in Medicine, v.~13, p.1149-1163, 1994.
McCullagh, P. Regression Methods for Ordinal Data. Journal of The Royal Statistical Society, Series B, v.42, p.109-142, 1980.
Menarin, V., Lara, I.A.R., Sila, C.S. Longitudinal model for categorical data applied in na agricultural experiment about elephant grass. Sci. Agric. v.74, n.4, p.265-274, July/August 2017 http://dx.doi.org/10.1590/1678-992X-2016-0067
Molenberghs, G. Verbeke, G. Models for discrete longitudinal data. New York: Springer-Verlag, 2005.
Paulino, C.D.; Singer, J.M. Análise de Dados Categorizados. São Paulo: Edgard Blücher, 2006.
Touloumis A, Agresti A, Kateri M. Generalized Estimating Equations for Multinomial Responses Using a Local Odds Ratio Parameterization. Biometrics, v.69, p.633–640, 2013.
Touloumis A. R Package multgee: A Generalized Estimating Equations Solver for Multinomial Responses. Journal of Statistical Software, v.64, p.1-14, 2015.
Yee, T. W. The VGAM package for categorical data analysis. Journal of Statistical Software, v. 32, p. 1–34. 2010. Available in http://www.jstatsoft.org/v32/i10
Zelterman, D. Models for discrete data. Oxford: 2006.