Avaliação molecular da variante no gene MTR na susceptibilidade à diabetes mellitus: uma abordagem integrada com machine learning

dc.contributor.advisor-co1Santos, Rodrigo da Silva
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4806187026900959
dc.contributor.advisor1Reis, Angela Adamski da Silva
dc.contributor.advisor1Latteshttps://lattes.cnpq.br/3243656364470085
dc.contributor.referee1Bailão, Alexandre Melo
dc.contributor.referee2Mourão, Aline Andrade
dc.contributor.referee3Santos, Rodrigo da Silva
dc.creatorRoriz, João Pedro Costa
dc.creator.Latteshttps://lattes.cnpq.br/4612082245868208
dc.date.accessioned2026-05-18T19:04:26Z
dc.date.available2026-05-18T19:04:26Z
dc.date.issued2026-02-24
dc.description.abstractType 2 diabetes mellitus (T2DM) is the most prevalent form of diabetes worldwide and represents a major public health challenge. In Brazil, its prevalence reaches 7.7%, imposing substantial economic and social burdens and reinforcing the need to elucidate the genetic and metabolic mechanisms underlying susceptibility to the disease. One-carbon metabolism plays a central role in regulating homocysteine levels, and variants in the MTR gene can destabilize this pathway, leading to hyperhomocysteinemia and increased risk for T2DM and its complications. To investigate this hypothesis, a population-based case–control study was conducted with more than 219 individuals matched by age and sex, with emphasis on the MTR rs1805087 variant. Genotyping data were analyzed under different inheritance models using chi-square tests and odds ratios (95% CI), and machine learning algorithms were applied to evaluate predictive performance through accuracy, precision, sensitivity, and ROC/AUC metrics. Although no significant association was observed between the rs1805087 variant and T2DM, a borderline result emerged under the dominant model. On the other hand, in analyses restricted to cases, the rs1805087 variant showed a significant association with smoking in the codominant (p = 0.009) and recessive (p = 0.041) models, revealing gene–environment interactions. In the machine learning approach, the K‑Nearest Neighbors (KNN) algorithm demonstrated the most stable performance between training and testing, outperforming more complex models such as Random Forest, which showed evidence of overfitting. Moreover, the variant emerged as one of the most influential variables in the predictive model. Taken together, the findings suggest that the MTR rs1805087 variant may contribute to T2DM risk through gene–environment interactions, particularly with smoking, and highlight the potential of integrated approaches combining molecular genetics and machine learning to refine risk assessment in multifactorial diseases.eng
dc.description.resumoA diabetes mellitus tipo 2 (DM2) é a forma mais prevalente de diabetes em todo o mundo e representa um grande desafio de saúde pública. No Brasil, sua prevalência atinge 7,7%, impondo importantes impactos econômicos e sociais e reforçando a necessidade de elucidar os mecanismos genéticos e metabólicos envolvidos na suscetibilidade à doença. O metabolismo de um carbono desempenha papel central na regulação da homocisteína, e variantes no gene MTR podem desestabilizar essa via, levando à hiper-homocisteinemia e risco aumentado para DM2 e suas complicações. Para investigar essa hipótese, foi conduzido um estudo caso–controle de base populacional com mais de 219 indivíduos pareados por idade e sexo, com ênfase na variante MTR rs1805087. Os dados de genotipagem foram analisados em diferentes modelos de herança por meio de testes do qui-quadrado e cálculo de odds ratio (IC95%), e algoritmos de aprendizado de máquina foram aplicados para avaliar o desempenho preditivo por meio de métricas de acurácia, precisão, sensibilidade e ROC/AUC. Embora não tenha sido observada associação significativa entre a variante rs1805087 e DM2, um resultado limítrofe surgiu no modelo dominante. Por outro lado, nas análises restritas aos casos, a variante rs1805087 mostrou associação significativa com o tabagismo para os modelos codominante (p=0,009) e recessivo (p=0,041) revelando interações genótipo–ambiente. Na abordagem de aprendizado de máquina, o algoritmo K-Nearest Neighbors (KNN) apresentou o desempenho mais estável entre treino e teste, superando modelos mais complexos como o Random Forest, que evidenciaram sobreajuste. Além disso, a variante destacouse como uma das variáveis mais influentes na predição. Em conjunto, os achados sugerem que a variante MTR rs1805087 pode contribuir para o risco de DM2 por meio de interações gene– ambiente, particularmente com o tabagismo, e destacam o potencial de abordagens integradas que combinam genética molecular e aprendizado de máquina para refinar a avaliação de risco em doenças multifatoriais.
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES
dc.identifier.citationRORIZ, João Pedro Costa Roriz. Avaliação molecular da variante no gene MTR na susceptibilidade à diabetes mellitus: uma abordagem integrada com machine learning. 2026. [101 f.]. Dissertação (Mestrado em Genética e Biologia Molecular) - Instituto de Ciências Biológicas, Universidade Federal de Goiás, Goiânia, 2026.
dc.identifier.urihttps://repositorio.bc.ufg.br/tede/handle/tede/15385
dc.languagePortuguêspor
dc.publisherUniversidade Federal de Goiáspor
dc.publisher.countryBrasilpor
dc.publisher.departmentInstituto de Ciências Biológicas - ICB (RMG)
dc.publisher.initialsUFGpor
dc.publisher.programPrograma de Pós-graduação em Genética e Biologia Molecular (ICB)
dc.rightsAcesso Embargado
dc.subjectDiabetes mellitus tipo 2por
dc.subjectVariante de Nucleotídeo Únicopor
dc.subjectAprendizado de Máquinapor
dc.subjectTabagismo; Medicina de Precisãopor
dc.subjectType 2 Diabetes mellituseng
dc.subjectSingle Nucleotide Varianteng
dc.subjectMachine Learningeng
dc.subjectSmoking; Prediction Medicineeng
dc.subject.cnpqCIENCIAS BIOLOGICAS::GENETICA
dc.titleAvaliação molecular da variante no gene MTR na susceptibilidade à diabetes mellitus: uma abordagem integrada com machine learning
dc.title.alternativeMolecular avaliation of variant on the MTR gene on the susceptibility to type 2 diabetes mellitus: An integrated analysis with machine learningeng
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação - João Pedro Costa Roriz - 2026.pdf
Tamanho:
6.97 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: