Validação da espectroscopia ATR-FTIR associada ao Machine Learning para identificação de um polimorfismo genético
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Polimorfismos de nucleotídeo único (SNPs) desempenham um papel central na suscetibilidade genética a distúrbios multifatoriais, como obesidade e diabetes mellitus tipo 2 (DM2), o que evidencia a necessidade de estratégias de genotipagem escaláveis e de baixo custo. Este estudo avaliou a viabilidade da espectroscopia no infravermelho com transformada de Fourier por reflexão total atenuada (ATR-FTIR) combinada a machine learning (ML) para discriminar os diferentes tipos de genótipos do SNP -3826A/G localizado no gene UCP1. A genotipagem do SNP foi realizada pela PCR quantitativa em tempo real (qPCR) utilizando ensaios TaqMan em amostras de DNA extraído do sangue de 190 participantes para a definição dos grupos genotípicos (AA, AG e GG). A PCR qualitativa foi realizada em todas as amostras e nos controles negativos de reação (NTCs). Os amplicons da PCR e os NTCs foram utilizados na análise espectral. As análises de componentes principais (PCA), modelos supervisionados de ML e deep learning (DL) foram aplicadas diretamente aos espectros normalizados por Variância Normal Padrão (SNV) nos intervalos espectrais de 2800–3800 cm?¹ , 950–1200 cm?¹ e 900 – 1100 cm?¹ . A viabilidade da técnica de ATR-FTIR associada ao ML foi avaliada por meio da comparação com a qPCR e o sequenciamento de nova geração (NGS), ambas técnicas de genotipagem consideradas atualmente padrão ouro. O melhor desempenho observado na discriminação entre os genótipos AA e GG foi obtido com o modelo de DL de perceptron multicamdas com arquitetura residual simulada na região de 2800–3800 cm?¹, área sob a curva (AUC) de 0,654 e acurácia de 0,716. Nas regiões de fingerprint do DNA de 900–1100 cm?¹ e 950–1200 cm?¹, o melhor desempenho foi observado com o modelo de regressão logística, com AUC de 0,635 e 0,644 e acurácia de 0,696 e 0,720, respectivamente. A técnica de ATR-FTIR associada ao ML apresentou melhor viabilidade de execução em relação as técnicas de sequenciamento e qPCR, com um tempo de processamento por amostra similar a qPCR e menor que o NGS e um custo inferior a ambas as técnicas. Este estudo é pioneiro na aplicação da espectroscopia ATR-FTIR associada ao ML na discriminação de SNPs do genoma humano, mostrando ser uma abordagem com um alto potencial de rastreamento, relativamente rápida e de baixo custo. O estabelecimento de novos critérios e modelos de ML poderão aumentar significativamente o desempenho da técnica na identificação desses polimorfismos genéticos.