Predição de acidentes de trânsito em Santa Catarina

avaliando o impacto do pré-processamento dos dados no desempenho dos modelos

Authors

Keywords:

Aprendizado de Máquina. Predição de Acidentes de Trânsito. Integração de Dados.

Abstract

Este estudo teve como objetivo investigar o impacto do pré-processamento de dados no desempenho de modelos preditivos de acidentes de trânsito. A questão central da pesquisa foi verificar a possibilidade de obter ganhos de desempenho apenas com o enriquecimento dos dados. Para isso, a pesquisa utilizou dados da PRF sobre acidentes entre os quilômetros 100 e 239 da rodovia BR-101 em SC, de 2017 a 2024. Primeiramente, constatou-se inconsistências nos dados, o que motivou sua correção e o enriquecimento com dados meteorológicos e de tráfego, gerando cinco conjuntos de dados para treinamento. Treinaram-se três modelos de aprendizado de máquina: RF, SVM e MLP, para cada conjunto de dados, totalizando quinze modelos. Os resultados mostraram que a correção de inconsistências nos dados aumentou o desempenho dos modelos, enquanto a adição de novos atributos produziu ganhos mais modestos, dependendo do modelo.

Downloads

Download data is not yet available.

Author Biographies

  • Gustavo Konescki Führ, Universidade Federal de Santa Catarina (UFSC)

    Graduando em Ciências da Computação pela Universidade Federal de Santa Catarina (UFSC), com interesse em área de pesquisa , como aprendizado de máquina, ciência de dados. ORCID: https://orcid.org/0009-0005-4444-4193.

  • Eduardo Camilo Inacio, Universidade Federal de Santa Catarina (UFSC)

    Doutor em Ciência da Computação, Mestre em Ciência da Computação e Bacharel em Sistemas de Informação, todos pela Universidade Federal de Santa Catarina (UFSC). Durante o doutorado, realizou um período sanduíche no RIKEN Advanced Institute for Computational Science (AICS), atual RIKEN Center for Computational Science (R-CCS), na cidade de Kobe, Japão. Professor Adjunto no Departamento de Informática e Estatística (INE) do Centro Tecnológico (CTC) da UFSC. Como University Ambassador e Certified Instructor no NVIDIA Deep Learning Institute (DLI), conduz workshops sobre inteligência artificial e computação acelerada com GPU desde 2022. É membro da comissão executiva da Comissão Regional de Alto Desempenho da Região Sul (CRAD/RS) desde 2024 e Representante Institucional da UFSC na Sociedade Brasileira de Computação (SBC) desde 2025. Seus principais interesses de pesquisa incluem inteligência artificial (machine learning, deep learning), computação de alto desempenho (HPC) e armazenamento distribuído. ORCID: https://orcid.org/0000-0003-3424-8269

References

AGÊNCIA NACIONAL DE TRANSPORTES TERRESTRES (ANTT). Base de dados de rodovias federais. Brasília: ANTT, 2025. Disponível em: <https://dados.antt.gov.br/group/rodovias?page=2>. Acesso em: 27 set. 2025.

CAI, Qing et al. Real-time crash prediction on expressways using deep generative models. Transportation Research Part C: Emerging Technologies, Amsterdã, v. 117, p. 102697, 2020. ISSN 0968-090X. Disponível em: <https://doi.org/10.1016/j.trc.2020.102697>. Acesso em: 27 set. 2025.

CONFEDERAÇÃO NACIONAL DO TRANSPORTE (CNT). Anuário CNT do transporte 2022. Brasília: CNT, 2022. Disponível em: <https://cnt.org.br/documento/78a521c3-b71c-456b-85c8-e4ddf5e51166>. Acesso em: 6 jul. 2025.

DEPARTAMENTO NACIONAL DE INFRAESTRUTURA DE TRANSPORTES (DNIT). VGeo – Sistema de Informações Geográficas do DNIT. Brasília: DNIT, 2025. Disponível em: <https://servicos.dnit.gov.br/vgeo/>. Acesso em: 7 mar. 2025.

DEPARTAMENTO NACIONAL DE INFRAESTRUTURA DE TRANSPORTES (DNIT). Pesquisa Nacional de Contagem de Tráfego (PNCT). Brasília: DNIT, 2025. Disponível em: <https://servicos.dnit.gov.br/dadospnct>. Acesso em: 7 mar. 2025.

ELASSAD, Zouhair; MOUSANNIF, Hajar; AL MOATASSIME, Hassan. A proactive decision support system for predicting traffic crash events: A critical analysis of imbalanced class distribution. Knowledge-Based Systems, Amsterdã, v. 205, p. 106314, 2020. ISSN 0950-7051. Disponível em: <https://doi.org/10.1016/j.knosys.2020.106314>. Acesso em: 27 set. 2025.

FERREIRA, Martines et al. Utilização da inteligência artificial na predição de acidentes de trânsito na cidade de Campo Grande–MS. Revista Camalotes, Campo Grande, v. 3, n. 2, p. 1‑11, 2024. ISSN 2965‑7498. Disponível em: <https://doi.org/10.62559/recam.v3i2.96>. Acesso em: 18 dez. 2025.

GIL, A. C. Métodos e técnicas de pesquisa social. 6.ed. São Paulo: Atlas, 2008.

HAYKIN, Simon S. Redes neurais: princípios e prática. 2.ed. Porto Alegre: Bookman, 2001.

HUANG, Tingting; WANG, Shuo; SHARMA, Anuj. Highway crash detection and risk estimation using deep learning. Accident Analysis & Prevention, Amsterdã, v. 135, p. 105392, 2020. ISSN 0001-4575. Disponível em: <https://doi.org/10.1016/j.aap.2019.105392>. Acesso em: 27 set. 2025.

ISLAM, Zubayer et al. Crash data augmentation using variational autoencoder. Accident Analysis & Prevention, Amsterdã, v. 151, p. 105950, 2021. ISSN 0001-4575. Disponível em: <https://doi.org/10.1016/j.aap.2020.105950>. Acesso em: 27 set. 2025.

KRAUT, Caio; SAPIA, Helton Molina. Aprendizado de máquina utilizando agrupamento e regressão na previsão de locais de acidentes de trânsito em zonas urbanas. Colloquium Exactarum, São Paulo, v. 14, n. 1, p. 1–11, 2022. ISSN: 2178-8332. Disponível em: <https://journal.unoeste.br/index.php/ce/article/view/4280>. Acesso em: 18 dez. 2025.

MO, Weiwei et al. Dynamic short-term crash analysis and prediction at toll plazas for proactive safety management. Accident Analysis & Prevention, Amsterdã, v. 197, p. 107456, 2024. ISSN 0001-4575. Disponível em: <https://doi.org/10.1016/j.aap.2024.107456>. Acesso em: 27 set. 2025.

PENG, Yichuan et al. Examining imbalanced classification algorithms in predicting real-time traffic crash risk. Accident Analysis & Prevention, Amsterdã, v. 144, p. 105610, 2020. ISSN 0001-4575. Disponível em: <https://doi.org/10.1016/j.aap.2020.105610>. Acesso em: 27 set. 2025.

POLÍCIA RODOVIÁRIA FEDERAL (PRF). Dados abertos da PRF. Brasília: PRF, 2024. Disponível em: <https://www.gov.br/prf/pt-br/acesso-ainformacao/dados-abertos/dados-abertos-da-prf>. Acesso em: 22 jul. 2025.

TAN, Pang-Ning; STEINBACH, Michael; KUMAR, Vipin. Introdução ao Data Mining: Mineração de Dados. Rio de Janeiro: Ciência Moderna, 2009.

TRAN, Thanh et al. MSGNN: A Multi-structured Graph Neural Network model for real-time incident prediction in large traffic networks. Transportation Research Part C: Emerging Technologies, Amsterdã, v. 156, p. 104354, 2023. ISSN 0968-090X. Disponível em: <https://doi.org/10.1016/j.trc.2023.104354>. Acesso em: 27 set. 2025.

WORLD HEALTH ORGANIZATION (WHO). Global plan for the decade of action for road safety 2021–2030. Geneva: WHO, 2021. Disponível em: <https://www.who.int/pt/publications/m/item/global-plan-for-the-decade-of-action-for-road-safety-2021-2030>. Acesso em: 23 jul. 2025.

WORLD HEALTH ORGANIZATION (WHO). Global Status Report on Road Safety 2023. Geneva: WHO, 2023. Disponível em: <https://www.who.int/teams/social-determinants-ofhealth/safety-and-mobility/global-status-report-on-road-safety-2023>. Acesso em: 26 jul. 2025.

YU, Le et al. Deep spatio-temporal graph convolutional network for traffic accident prediction. Neurocomputing, Amsterdã, v. 423, p. 135–147, 2021. ISSN 0925-2312. Disponível em: <https://doi.org/10.1016/j.neucom.2020.09.043>. Acesso em: 27 set. 2025.

ZHAO, Chao et al. Unsupervised anomaly detection based method of risk evaluation for road traffic accident. Applied Intelligence, Dordrecht, v. 53, p. 369–384, 2023. Disponível em: <https://doi.org/10.1007/s10489-022-03501-8>. Acesso em: 27 set. 2025.

ZHAO, Liping et al. Highway Traffic Crash Risk Prediction Method considering Temporal Correlation Characteristics. Journal of Advanced Transportation, Londres, 2023. Disponível em: <https://doi.org/10.1155/2023/9695433>. Acesso em: 27 set. 2025.

ZIPPENFENIG, Patrick. Open-Meteo.com Weather API. 2023. Disponível em: <https://open-meteo.com/> . Acesso em: 26 jul. 2025.

Published

2026-04-10

How to Cite

Predição de acidentes de trânsito em Santa Catarina: avaliando o impacto do pré-processamento dos dados no desempenho dos modelos. (2026). Revista Brasileira De Iniciação Científica, e026014. https://periodicoscientificos.itp.ifsp.edu.br/index.php/rbic/article/view/2626