Análise exploratória gráfica para dados assimétricos com presença de pontos discrepantes
Palavras-chave:
Box-plot, Box-plot ajustado, Histograma, Medidas resumoResumo
Introdução: A representação gráfica é uma das formas utilizadas para observar a distribuição dos dados de uma variável contínua. Objetivo: Comparar ferramentas gráficas para análise exploratória de dados com distribuições assimétricas e presença de pontos outliers. Metodologia: Construções de gráficos box-plot com observações discrepantes são avaliadas e uma aplicação é feita a dados de consumo alimentar. Resultados: As distribuições de consumo alimentar apresentaram assimetrias acentuadas à direita com presença de pontos discrepantes, e os gráficos de box-plot e box-plot ajustados classificaram tais pontos de formas distintas. Conclusões: Para dados com assimetria, os box-plot ajustados evidenciam observações com alta discrepância.
Downloads
Referências
ASSUMPÇÃO, D. D. et al. Diferenças entre homens e mulheres na qualidade da dieta: estudo de base populacional em Campinas, São Paulo, Ciência e Saúde Coletiva, Rio de Janeiro, v. 22, n. 2, p. 347-358, fev. 2017.
BRYS, G.; HUBERT, M..; STRUYF, A. A robust measure of skewness, Journal Computational and Graphical Statistics, v. 13, p. 996–1017, 2004.
DIAS, R. V. B. Modelagem baseada na distribuição. 2018. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Universidade de Brasília, Brasília, 2018.
FERRARI, S. L. P.; FUMES, G. Box-Cox symmetric distributions and applications to nutritional data. AStA-Advances in Statistical Analysis, v. 101, p. 321-344, 2017.
GUIMARÃES, F. P. Proposta de Criação de um Índice de Eficiência das Equipes de Fiscalização do Corpo de Bombeiros Militar do Estado de Mato Grosso Do Sul. 2019. Dissertação (Mestrado em Administração Pública) - Universidade Federal da Grande Dourados, Dourados, 2019.
HUBERT, M.; VANDERVIERENB, E. An adjusted boxplot for skewed distributions. Computational Statistics and Data Analysis, v. 52, n. 12, p. 5186-5201, ago. 2008.
LEIVA, V. The Birnbaum-Saunders Distribution, Academic Press, Londres, v.4, n.16, p. 996-1017, 2016.
MORETTIN, P. A.; BUSSAB, W. D. O. Estatística Básica. 9. ed. São Paulo: Saraiva, 2017.
MORETTIN, P. A.; SINGER, J. M. Introdução à Ciência de Dados: fundamentos e aplicações. São Paulo: Departamento de Estatística, USP, 2019.
MORIMOTO, J. M. et al. Variância intrapessoal para ajuste da distribuição de nutrientes em estudos epidemiológicos. Rev. Saúde Pública, São Paulo, v. 45, n. 3, p. 621-625, jun. 2011.
PADOVANI, R. M. et al. Dietary reference intakes: aplicabilidade das tabelas em estudos nutricionais. Revista de Nutrição, Campinas, v. 19, n. 6, p. 741-760, nov/dez 2006.
RSTUDIO. Disponível em: < https://www.rstudio.com>. Acesso em: 03 maio. 2022.
SEO, S. A Review and Comparison of Methods for Detecting Outliers. 2006. Dissertação (Mestrado em Saúde Pública) - Universidade de Pittsburgh Graduate School of Public Health, Pittsburgh, 2006.
SILVA, K. C. R. D Robust Outilier Labeling Rules for Light-tailed and Heavy-tailed dat. Tese (Doutorado em Ciências Matematicas e Cmputação) - Universidade de São Paulo: São Paulo, 2019.
Arquivos adicionais
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2022 Revista Brasileira de Iniciação Científica
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.