Análisis gráfico exploratorio para datos asimétricos con presencia de puntos atípicos
Palabras clave:
Diagrama de caja, Diagrama de caja ajustado, Histograma, Medidas de resumenResumen
Introducción: La representación gráfica es una forma utilizadas para observar la distribución de datos para variables continuas. Objetivo: Comparar herramientas gráficas para análisis exploratorio de datos con distribuciones asimétricas y presencia de puntos aislados. Metodología: Se evalúan construcciones de gráficas de caja con observaciones discrepantes y se hace una aplicación a datos de consumo alimentar. Resultados: Las distribuciones del consumo mostraron asimetrias acentuadas a la derecha con la presencia de puntos aislados, los gráficos de caja ajustados y estândar, clasificaron estos puntos de diferentes formas. Conclusiones: Para datos asimétricos, los diagramas de caja ajustados muestran observaciones con alta discrepancia.
Descargas
Citas
ASSUMPÇÃO, D. D. et al. Diferenças entre homens e mulheres na qualidade da dieta: estudo de base populacional em Campinas, São Paulo, Ciência e Saúde Coletiva, Rio de Janeiro, v. 22, n. 2, p. 347-358, fev. 2017.
BRYS, G.; HUBERT, M..; STRUYF, A. A robust measure of skewness, Journal Computational and Graphical Statistics, v. 13, p. 996–1017, 2004.
DIAS, R. V. B. Modelagem baseada na distribuição. 2018. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Universidade de Brasília, Brasília, 2018.
FERRARI, S. L. P.; FUMES, G. Box-Cox symmetric distributions and applications to nutritional data. AStA-Advances in Statistical Analysis, v. 101, p. 321-344, 2017.
GUIMARÃES, F. P. Proposta de Criação de um Índice de Eficiência das Equipes de Fiscalização do Corpo de Bombeiros Militar do Estado de Mato Grosso Do Sul. 2019. Dissertação (Mestrado em Administração Pública) - Universidade Federal da Grande Dourados, Dourados, 2019.
HUBERT, M.; VANDERVIERENB, E. An adjusted boxplot for skewed distributions. Computational Statistics and Data Analysis, v. 52, n. 12, p. 5186-5201, ago. 2008.
LEIVA, V. The Birnbaum-Saunders Distribution, Academic Press, Londres, v.4, n.16, p. 996-1017, 2016.
MORETTIN, P. A.; BUSSAB, W. D. O. Estatística Básica. 9. ed. São Paulo: Saraiva, 2017.
MORETTIN, P. A.; SINGER, J. M. Introdução à Ciência de Dados: fundamentos e aplicações. São Paulo: Departamento de Estatística, USP, 2019.
MORIMOTO, J. M. et al. Variância intrapessoal para ajuste da distribuição de nutrientes em estudos epidemiológicos. Rev. Saúde Pública, São Paulo, v. 45, n. 3, p. 621-625, jun. 2011.
PADOVANI, R. M. et al. Dietary reference intakes: aplicabilidade das tabelas em estudos nutricionais. Revista de Nutrição, Campinas, v. 19, n. 6, p. 741-760, nov/dez 2006.
RSTUDIO. Disponível em: < https://www.rstudio.com>. Acesso em: 03 maio. 2022.
SEO, S. A Review and Comparison of Methods for Detecting Outliers. 2006. Dissertação (Mestrado em Saúde Pública) - Universidade de Pittsburgh Graduate School of Public Health, Pittsburgh, 2006.
SILVA, K. C. R. D Robust Outilier Labeling Rules for Light-tailed and Heavy-tailed dat. Tese (Doutorado em Ciências Matematicas e Cmputação) - Universidade de São Paulo: São Paulo, 2019.
Archivos adicionales
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Revista Brasileira de Iniciação Científica
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.