Dados do Trabalho
Título
Modelagem de dados georreferenciados por aprendizagem de máquina para predição de áreas com favorabilidade ecológica e socioambiental à ocorrência de febre amarela no Brasil
Introdução
A identificação de áreas favoráveis à ocorrência de febre amarela (FA) é essencial para adoção de ações preventivas e mitigadoras de emergências em Saúde Pública. Contudo, a intrincada dinâmica de transmissão, com fatores bióticos e abióticos, além da extensão territorial e diversidade do Brasil, tornam essa tarefa um enorme desafio. Métodos de aprendizagem de máquina (AM), notáveis por modelar fenômenos complexos a partir de massa de dados, têm sido cada vez mais adotados no estudo da ocorrência de zoonoses
Objetivo (s)
Propor metodologia de modelagem de ocorrência de FA baseada em AM, em particular no algoritmo Support Vector Machine (SVM); predizer regiões favoráveis à ocorrência de FA segundo os modelos resultantes; e fornecer ferramenta e modelos em apoio à tomada de decisão
Material e Métodos
Compilou-se 341 casos georreferenciados de ocorrência de FA no país entre 08/2020 e 03/2024, distribuídos em SC (161), RS (107), GO (22), MG (19), PR (16), DF (10) e SP (6). Para cada ponto, calcularam-se estatísticas descritivas das características ambientais do entorno para três raios de influência, objetivando a análise multiescala: 100 m, 500 m e 1000 m. Os dados ambientais foram: cobertura florestal, altitude, precipitação e temperatura, que após o cômputo das estatísticas resultaram em 423 variáveis. A Análise de Componentes Principais (PCA) foi então aplicada, retendo 90%, 95% e 99% de variância, e treinaram-se diversos modelos SVM (Oneclass) com parâmetros distintos para fins de robustez. No total, 891 modelos foram obtidos (3 raios x 3 PCAs x 99 conjuntos de parâmetros). Destes, 223 alcançaram 90% de acurácia de treinamento e foram aplicados na grade de 1 km sobre o Brasil (~8,5 milhões de pontos) para gerar as predições
Resultados e Conclusão
As predições sobre a grade foram agregadas por região, produzindo índices proporcionais à favorabilidade. Os cinco estados que agregam as condições ecológicas e socioambientais mais favoráveis foram: SC, DF, PR, RS e RO e quando analisados os municípios isoladamente, Salgado Filho-PR, Manfrinópolis-PR, Bom Jesus do Sul-PR, Itatiba do Sul-RS e Severiano de Almeida-RS foram destacados. Neste estudo, apesar do viés amostral com forte influência do sul do país, identificaram-se as regiões com maiores índices de favorabilidade à ocorrência de FA. Estes apoiaram políticas públicas de vigilância da FA e resposta efetivas consolidando o uso de algoritmos de AM como métodos alternativos e complementares para identificação causas de fenômenos complexos e doenças infecciosas
Palavras Chave
Arboviroses; Support Vector Machine; modelos preditivos
Área
Eixo 17 | 1.Vigilância em saúde - Emergências em Saúde Pública
Prêmio Jovem Pesquisador
4.Não desejo concorrer
Autores
Marcia Chame, Douglas Adriano Augusto, Livia Abdalla, Eduardo Krempser, Daniel Garkauskas, Pedro Passos, Alessandro Pecego Romano