Graphical exploratory analysis for asymmetric data with the presence of outliers
Keywords:
Box-plot, Histogram, Summary statistics, Adjusted Box-plotAbstract
Introduction: The graphic is one of the forms used to observe the distribution of data for a continuous variable. Objective: To compare graphical tools for exploratory data analysis with asymmetric distributions and presence of outliers. Methodology: Constructions of box-plot charts with discrepant observations are evaluated and an application is made to food consumption data. Results: The food consumption distributions showed accentuated right asymmetry with the presence of discrepant points, and the adjusted box-plot and box-plot charts classified these points in different ways. Conclusions: For asymmetric data, the adjusted box-plots evidence observations with high discrepancy.
Downloads
References
ASSUMPÇÃO, D. D. et al. Diferenças entre homens e mulheres na qualidade da dieta: estudo de base populacional em Campinas, São Paulo, Ciência e Saúde Coletiva, Rio de Janeiro, v. 22, n. 2, p. 347-358, fev. 2017.
BRYS, G.; HUBERT, M..; STRUYF, A. A robust measure of skewness, Journal Computational and Graphical Statistics, v. 13, p. 996–1017, 2004.
DIAS, R. V. B. Modelagem baseada na distribuição. 2018. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Universidade de Brasília, Brasília, 2018.
FERRARI, S. L. P.; FUMES, G. Box-Cox symmetric distributions and applications to nutritional data. AStA-Advances in Statistical Analysis, v. 101, p. 321-344, 2017.
GUIMARÃES, F. P. Proposta de Criação de um Índice de Eficiência das Equipes de Fiscalização do Corpo de Bombeiros Militar do Estado de Mato Grosso Do Sul. 2019. Dissertação (Mestrado em Administração Pública) - Universidade Federal da Grande Dourados, Dourados, 2019.
HUBERT, M.; VANDERVIERENB, E. An adjusted boxplot for skewed distributions. Computational Statistics and Data Analysis, v. 52, n. 12, p. 5186-5201, ago. 2008.
LEIVA, V. The Birnbaum-Saunders Distribution, Academic Press, Londres, v.4, n.16, p. 996-1017, 2016.
MORETTIN, P. A.; BUSSAB, W. D. O. Estatística Básica. 9. ed. São Paulo: Saraiva, 2017.
MORETTIN, P. A.; SINGER, J. M. Introdução à Ciência de Dados: fundamentos e aplicações. São Paulo: Departamento de Estatística, USP, 2019.
MORIMOTO, J. M. et al. Variância intrapessoal para ajuste da distribuição de nutrientes em estudos epidemiológicos. Rev. Saúde Pública, São Paulo, v. 45, n. 3, p. 621-625, jun. 2011.
PADOVANI, R. M. et al. Dietary reference intakes: aplicabilidade das tabelas em estudos nutricionais. Revista de Nutrição, Campinas, v. 19, n. 6, p. 741-760, nov/dez 2006.
RSTUDIO. Disponível em: < https://www.rstudio.com>. Acesso em: 03 maio. 2022.
SEO, S. A Review and Comparison of Methods for Detecting Outliers. 2006. Dissertação (Mestrado em Saúde Pública) - Universidade de Pittsburgh Graduate School of Public Health, Pittsburgh, 2006.
SILVA, K. C. R. D Robust Outilier Labeling Rules for Light-tailed and Heavy-tailed dat. Tese (Doutorado em Ciências Matematicas e Cmputação) - Universidade de São Paulo: São Paulo, 2019.
Additional Files
Published
How to Cite
Issue
Section
License
Copyright (c) 2022 Revista Brasileira de Iniciação Científica
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.