Avaliação molecular da variante no gene MTR na susceptibilidade à diabetes mellitus: uma abordagem integrada com machine learning
| dc.contributor.advisor-co1 | Santos, Rodrigo da Silva | |
| dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/4806187026900959 | |
| dc.contributor.advisor1 | Reis, Angela Adamski da Silva | |
| dc.contributor.advisor1Lattes | https://lattes.cnpq.br/3243656364470085 | |
| dc.contributor.referee1 | Bailão, Alexandre Melo | |
| dc.contributor.referee2 | Mourão, Aline Andrade | |
| dc.contributor.referee3 | Santos, Rodrigo da Silva | |
| dc.creator | Roriz, João Pedro Costa | |
| dc.creator.Lattes | https://lattes.cnpq.br/4612082245868208 | |
| dc.date.accessioned | 2026-05-18T19:04:26Z | |
| dc.date.available | 2026-05-18T19:04:26Z | |
| dc.date.issued | 2026-02-24 | |
| dc.description.abstract | Type 2 diabetes mellitus (T2DM) is the most prevalent form of diabetes worldwide and represents a major public health challenge. In Brazil, its prevalence reaches 7.7%, imposing substantial economic and social burdens and reinforcing the need to elucidate the genetic and metabolic mechanisms underlying susceptibility to the disease. One-carbon metabolism plays a central role in regulating homocysteine levels, and variants in the MTR gene can destabilize this pathway, leading to hyperhomocysteinemia and increased risk for T2DM and its complications. To investigate this hypothesis, a population-based case–control study was conducted with more than 219 individuals matched by age and sex, with emphasis on the MTR rs1805087 variant. Genotyping data were analyzed under different inheritance models using chi-square tests and odds ratios (95% CI), and machine learning algorithms were applied to evaluate predictive performance through accuracy, precision, sensitivity, and ROC/AUC metrics. Although no significant association was observed between the rs1805087 variant and T2DM, a borderline result emerged under the dominant model. On the other hand, in analyses restricted to cases, the rs1805087 variant showed a significant association with smoking in the codominant (p = 0.009) and recessive (p = 0.041) models, revealing gene–environment interactions. In the machine learning approach, the K‑Nearest Neighbors (KNN) algorithm demonstrated the most stable performance between training and testing, outperforming more complex models such as Random Forest, which showed evidence of overfitting. Moreover, the variant emerged as one of the most influential variables in the predictive model. Taken together, the findings suggest that the MTR rs1805087 variant may contribute to T2DM risk through gene–environment interactions, particularly with smoking, and highlight the potential of integrated approaches combining molecular genetics and machine learning to refine risk assessment in multifactorial diseases. | eng |
| dc.description.resumo | A diabetes mellitus tipo 2 (DM2) é a forma mais prevalente de diabetes em todo o mundo e representa um grande desafio de saúde pública. No Brasil, sua prevalência atinge 7,7%, impondo importantes impactos econômicos e sociais e reforçando a necessidade de elucidar os mecanismos genéticos e metabólicos envolvidos na suscetibilidade à doença. O metabolismo de um carbono desempenha papel central na regulação da homocisteína, e variantes no gene MTR podem desestabilizar essa via, levando à hiper-homocisteinemia e risco aumentado para DM2 e suas complicações. Para investigar essa hipótese, foi conduzido um estudo caso–controle de base populacional com mais de 219 indivíduos pareados por idade e sexo, com ênfase na variante MTR rs1805087. Os dados de genotipagem foram analisados em diferentes modelos de herança por meio de testes do qui-quadrado e cálculo de odds ratio (IC95%), e algoritmos de aprendizado de máquina foram aplicados para avaliar o desempenho preditivo por meio de métricas de acurácia, precisão, sensibilidade e ROC/AUC. Embora não tenha sido observada associação significativa entre a variante rs1805087 e DM2, um resultado limítrofe surgiu no modelo dominante. Por outro lado, nas análises restritas aos casos, a variante rs1805087 mostrou associação significativa com o tabagismo para os modelos codominante (p=0,009) e recessivo (p=0,041) revelando interações genótipo–ambiente. Na abordagem de aprendizado de máquina, o algoritmo K-Nearest Neighbors (KNN) apresentou o desempenho mais estável entre treino e teste, superando modelos mais complexos como o Random Forest, que evidenciaram sobreajuste. Além disso, a variante destacouse como uma das variáveis mais influentes na predição. Em conjunto, os achados sugerem que a variante MTR rs1805087 pode contribuir para o risco de DM2 por meio de interações gene– ambiente, particularmente com o tabagismo, e destacam o potencial de abordagens integradas que combinam genética molecular e aprendizado de máquina para refinar a avaliação de risco em doenças multifatoriais. | |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | |
| dc.identifier.citation | RORIZ, João Pedro Costa Roriz. Avaliação molecular da variante no gene MTR na susceptibilidade à diabetes mellitus: uma abordagem integrada com machine learning. 2026. [101 f.]. Dissertação (Mestrado em Genética e Biologia Molecular) - Instituto de Ciências Biológicas, Universidade Federal de Goiás, Goiânia, 2026. | |
| dc.identifier.uri | https://repositorio.bc.ufg.br/tede/handle/tede/15385 | |
| dc.language | Português | por |
| dc.publisher | Universidade Federal de Goiás | por |
| dc.publisher.country | Brasil | por |
| dc.publisher.department | Instituto de Ciências Biológicas - ICB (RMG) | |
| dc.publisher.initials | UFG | por |
| dc.publisher.program | Programa de Pós-graduação em Genética e Biologia Molecular (ICB) | |
| dc.rights | Acesso Embargado | |
| dc.subject | Diabetes mellitus tipo 2 | por |
| dc.subject | Variante de Nucleotídeo Único | por |
| dc.subject | Aprendizado de Máquina | por |
| dc.subject | Tabagismo; Medicina de Precisão | por |
| dc.subject | Type 2 Diabetes mellitus | eng |
| dc.subject | Single Nucleotide Variant | eng |
| dc.subject | Machine Learning | eng |
| dc.subject | Smoking; Prediction Medicine | eng |
| dc.subject.cnpq | CIENCIAS BIOLOGICAS::GENETICA | |
| dc.title | Avaliação molecular da variante no gene MTR na susceptibilidade à diabetes mellitus: uma abordagem integrada com machine learning | |
| dc.title.alternative | Molecular avaliation of variant on the MTR gene on the susceptibility to type 2 diabetes mellitus: An integrated analysis with machine learning | eng |
| dc.type | Dissertação |