Dados do Trabalho


Título

UTILIZAÇÃO DE LINKAGE PROBABILÍSTICO PARA UNIÃO DE BASES DE DADOS DOS SISTEMAS DE INFORMAÇÃO

Introdução

O Ministério da Saúde do Brasil, através do DATASUS, é responsável pelo gerenciamento de diversos Sistemas de Informação em Saúde. Estes têm como principal objetivo melhorar o monitoramento, a coleta de dados e a vigilância epidemiológica de doenças. Dentre os principais bancos de dados, podemos destacar o Sistema de Informação de Agravos de Notificação (SINAN) e o Sistema de Informação de Vigilância Epidemiológica (SIVEP).

Objetivo (s)

Este trabalho tem como objetivo demonstrar um método de Linkage entre as bases SINAN-Hepatites e SIVEP-Malária, entre os anos 2010 a 2019, utilizando a linguagem R no ambiente RStudio

Material e Métodos

Este projeto foi aceito pelo comitê de ética em pesquisa da Fundação de Medicina Tropical Dr. Heitor Vieira Dourado (CAAE 69779023700000005). Antes da realização do Linkage é necessária a limpeza e padronização, utilizando o pacote Tidyverse. Padronizamos o nome, data de nascimento do paciente e o nome da mãe, deixando-os em letra minúscula, sem acento gráfico e preposições de sobrenome. Após esta etapa é realizada a deduplicação da base, utilizando o pacote RecordLinkage, nesta etapa os pacientes têm seu nome comparado com possíveis pares presentes na própria base de dados. Devido a possibilidade de pares falsos, o programa atribui um peso que varia de 0 a 1 para determinar se é um par verdadeiro ou não, onde 0 representa correspondência nula e 1 perfeita, além de atribuir uma ID única para cada paciente. Neste trabalho consideramos o limite de peso de 0.7 para pares verdadeiros. Após a realização da deduplicação para cada base, é realizado o pareamento delas. Para o pareamento os bancos necessitam apresentar variáveis iguais, a serem selecionadas e agrupadas, formando uma única base.

Resultados e Conclusão

Os dados do  SINAN-Hepatites, no período do estudo apresentou 32.686 casos notificados e após o processo de deduplicação, observou-se que 2.582 registros apresentaram mais de uma notificação por indivíduo, devido a múltiplas entradas de pacientes. Já a base de dados SIVEP-Malária apresentou 720.409 registros e após a deduplicação, 117.041 apresentaram mais de um registro. No pareamento das duas bases, foi constatado que 13.343 pacientes apresentaram registros em ambas. Como existem diversos sistemas de informação no âmbito da saúde, e a falta de uma variável unívoca que nos auxilie em estudos, o processo de Linkage probabilístico se mostra eficaz para que a união dos bancos seja mais otimizada, visando auxiliar nos estudos acerca das doenças que acometem a população.

Palavras Chave

Linkage; Bases de dados; Sistemas de informação.

Área

Eixo 02 | 3.Tecnologia e Inovação em saúde - Outras

Prêmio Jovem Pesquisador

4.Não desejo concorrer

Autores

Felipe Nery Saldanha Braga, Patrícia Carvalho da Silva Balieiro, Jady Shayenne Mota Cordeiro, Alexandre Vilhena da Silva Neto, Gabriel dos Santos Mouta, Antônio Alcirley da Silva Balieiro, Wuelton Marcelo Monteiro, Vanderson de Souza Sampaio