Graphical exploratory analysis for asymmetric data with the presence of outliers

Authors

Keywords:

Box-plot, Histogram, Summary statistics, Adjusted Box-plot

Abstract

Introduction: The graphic is one of the forms used to observe the distribution of data for a continuous variable. Objective: To compare graphical tools for exploratory data analysis with asymmetric distributions and presence of outliers. Methodology: Constructions of box-plot charts with discrepant observations are evaluated and an application is made to food consumption data. Results: The food consumption distributions showed accentuated right asymmetry with the presence of discrepant points, and the adjusted box-plot and box-plot charts classified these points in different ways. Conclusions: For asymmetric data, the adjusted box-plots evidence observations with high discrepancy.

Downloads

Download data is not yet available.

Author Biographies

Ana Flávia Giacondino Soligo Lezcano Tatis, Universidade de São Paulo

Graduanda em Engenharia de Alimentos. Faculdade de Zootecnia e Engenharia de Alimentos, Universidade de São Paulo. ORCID: https://orcid.org/0000-0002-3974-8214

José Eduardo Corrente, Universidade Estadual Paulista

Doutor em Estatística e Experimentação Agronômica. Faculdade de Medicina, Universidade Estadual Paulista “Júlio de Mesquita Filho”. ORCID: https://orcid.org/0000-0001-5478-4996

Giovana Fumes-Ghantous, Universidade de São Paulo

Doutor em Estatística. Departamento de Ciências Básicas. Faculdade de Zootecnia e Engenharia de Alimentos, Universidade de São Paulo. ORCID: https://orcid.org/0000-0002-1505-1826

References

ASSUMPÇÃO, D. D. et al. Diferenças entre homens e mulheres na qualidade da dieta: estudo de base populacional em Campinas, São Paulo, Ciência e Saúde Coletiva, Rio de Janeiro, v. 22, n. 2, p. 347-358, fev. 2017.

BRYS, G.; HUBERT, M..; STRUYF, A. A robust measure of skewness, Journal Computational and Graphical Statistics, v. 13, p. 996–1017, 2004.

DIAS, R. V. B. Modelagem baseada na distribuição. 2018. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Universidade de Brasília, Brasília, 2018.

FERRARI, S. L. P.; FUMES, G. Box-Cox symmetric distributions and applications to nutritional data. AStA-Advances in Statistical Analysis, v. 101, p. 321-344, 2017.

GUIMARÃES, F. P. Proposta de Criação de um Índice de Eficiência das Equipes de Fiscalização do Corpo de Bombeiros Militar do Estado de Mato Grosso Do Sul. 2019. Dissertação (Mestrado em Administração Pública) - Universidade Federal da Grande Dourados, Dourados, 2019.

HUBERT, M.; VANDERVIERENB, E. An adjusted boxplot for skewed distributions. Computational Statistics and Data Analysis, v. 52, n. 12, p. 5186-5201, ago. 2008.

LEIVA, V. The Birnbaum-Saunders Distribution, Academic Press, Londres, v.4, n.16, p. 996-1017, 2016.

MORETTIN, P. A.; BUSSAB, W. D. O. Estatística Básica. 9. ed. São Paulo: Saraiva, 2017.

MORETTIN, P. A.; SINGER, J. M. Introdução à Ciência de Dados: fundamentos e aplicações. São Paulo: Departamento de Estatística, USP, 2019.

MORIMOTO, J. M. et al. Variância intrapessoal para ajuste da distribuição de nutrientes em estudos epidemiológicos. Rev. Saúde Pública, São Paulo, v. 45, n. 3, p. 621-625, jun. 2011.

PADOVANI, R. M. et al. Dietary reference intakes: aplicabilidade das tabelas em estudos nutricionais. Revista de Nutrição, Campinas, v. 19, n. 6, p. 741-760, nov/dez 2006.

RSTUDIO. Disponível em: < https://www.rstudio.com>. Acesso em: 03 maio. 2022.

SEO, S. A Review and Comparison of Methods for Detecting Outliers. 2006. Dissertação (Mestrado em Saúde Pública) - Universidade de Pittsburgh Graduate School of Public Health, Pittsburgh, 2006.

SILVA, K. C. R. D Robust Outilier Labeling Rules for Light-tailed and Heavy-tailed dat. Tese (Doutorado em Ciências Matematicas e Cmputação) - Universidade de São Paulo: São Paulo, 2019.

Published

2022-09-15

How to Cite

Giacondino Soligo Lezcano Tatis, A. F., Corrente, J. E., & Fumes-Ghantous, G. (2022). Graphical exploratory analysis for asymmetric data with the presence of outliers. Revista Brasileira De Iniciação Científica, 9, e022017. Retrieved from https://periodicoscientificos.itp.ifsp.edu.br/index.php/rbic/article/view/540