Oliveira, Virgínia Klausner deCustódio, Paulo Rogério Siqueira2025-01-302025-01-302023-03-07https://repositorio.univap.br/handle/123456789/532Essa pesquisa trata-se da utilização de florestas aleatórias para criação de uma metodologia para desenvolvimento de um modelo capaz de fazer previsão de casos verdadeiros positivos na triagem neonatal de fibrose cística, utilizando dados sintéticos para treinamento do modelo e variando os parâmetros do modelo para buscar aquele que retorne o melhor poder preditivo, assim tendo uma prova de conceito para utilização dessa metodologia para encontrar um modelo capaz de fazer a previsão de verdadeiros positivos para fibrose cística em um banco de dados real. A fibrose cística é uma doença, que faz parte do programa nacional de triagem neonatal brasileiro que é causada por mutações do gene de Condutância Transmembrana da Fibrose Cística (CFTR, do inglês Cystic Fibrosis Transmembrane Conductance Regulator). Esta doença é caracterizada pela produção de um muco espesso podendo causar problemas respiratórios, gastrointestinais, complicações metabólicas entre outras enfermidades que variam de acordo com as mais de 2000 mutações existentes. Já a floresta aleatória é um algoritmo comum de aprendizado de máquina que consiste em utilizar um banco de dados para treinar um modelo de inúmeras árvores de decisão capazes de criar critérios para tentar explicar um dado alvo baseando-se em atributos, para poder fazer previsões em um novo banco de dados desconhecido utilizando somente os atributos. Esse tipo de tecnologia vem ganhando espaço na área da saúde principalmente na área de diagnóstico por conta de seu alto poder preditivo. A triagem dessa doença faz parte do programa de tiragem neonatal brasileiro através do teste do pezinho, que é feita com a quantificação da tripsina imunorreativa, este exame possui alta incidência de falsos positivos. Se esta prova de conceito for positiva pode-se fornecer atendimento precoce a esses pacientes, aumentando suas expectativas de vida. Para isso, foi utilizado índices gerais (número de pacientes triados e número de exames alterados) de triagens e diagnóstico do laboratório de triagem neonatal APAE (Associação de Pais e Amigos dos Excepcionais) de São Luís do Maranhão, para desenvolver uma metodologia que buscasse sempre a melhor sensibilidade para o modelo. Os resultados obtidos nesta dissertação com dados sintéticos mostram que essa metodologia pode permitir alcançar o objetivo devido a melhora que ela trouxe na sensibilidade do modelo mesmo que utilizando dados sintéticos para o treinamento, o que tende a melhorar quando utilizar dados reais de pacientes, pois a correlação desses dados será maior o que fará com que o modelo tenha melhor ajuste sobre os dados sendo capaz de explica-los com a sensibilidade e precisão superior à obtida com os dados sintéticos.PDFpt-BRAnálise de dados do programa de triagem neonatal de fibrose cística através da quantificação de IRT – Tripsinogênio Imunorreativo utilizando aprendizado de máquina para reduzir falsos positivosData analysis of neonatal screening program of cystic fibrosis through the quantification of IRT - trypsinogen immunorreative using machine learning to reduce false positivesDissertaçãoFibrose císticaTriagem neonatalTripsina imunorreativaCUSTÓDIO, Paulo Rogério Siqueira. Análise de dados do programa de triagem neonatal de fibrose cística através da quantificação de IRT – Tripsinogênio Imunorreativo utilizando aprendizado de máquina para reduzir falsos positivos. São José dos Campos, 2024. 92 f. Dissertação (Mestrado em Engenharia Biomédica) - Universidade do Vale do Paraíba, Instituto de Pesquisa e Desenvolvimento, Sâo José dos Campos, 2024,Universidade do Vale do Paraíba