Thermopred : aplicação de inteligência artificial e química quântica na predição de propriedade termoquímica e espontaneidade de reações de degradação em insumos farmacêuticos ativos
| dc.contributor.advisor1 | Oliveira, Heibbe Cristhian Benedito de | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5995553993631378 | |
| dc.contributor.referee1 | Ribeiro, Alany Ingrid | |
| dc.contributor.referee2 | Silva, Alisson Moraes e | |
| dc.contributor.referee3 | Machado, Daniel Scalabrini | |
| dc.contributor.referee4 | Colherinhas, Guilherme | |
| dc.contributor.referee5 | Oliveira, Heibbe Cristhian Benedito de | |
| dc.creator | Santos, Diullio Pereira dos | |
| dc.creator.Lattes | http://lattes.cnpq.br/4983570990617578 | |
| dc.date.accessioned | 2026-04-24T19:04:10Z | |
| dc.date.available | 2026-04-24T19:04:10Z | |
| dc.date.issued | 2026-02-27 | |
| dc.description.abstract | We developed artificial intelligence models to predict thermodynamic properties associated with the degradation of active pharmaceutical ingredients (APIs), focusing on Gibbs free energy (ΔG) and enthalpy (ΔH), in alignment with RDC No. 964/2025 issued by ANVISA, which reinforces the need for a deeper mechanistic understanding of forced degradation studies. A novel dataset comprising more than 14,000 chemical structures, including APIs and their degradation products, was constructed from the Brazilian DCB list and public databases such as PubChem. Thermodynamic properties were calculated using quantum chemical methods in Gaussian 16 at the M06-2X/6-31G(d) level of theory. Molecular representation was performed using Morgan fingerprints (RDKit), with structural similarity assessed through the Tanimoto coefficient. Thermodynamic variables were normalized to optimize model training and subsequently transformed back to their original scale to preserve physicochemical interpretability. Three machine learning algorithms—XGBoost, Random Forest, and Multilayer Perceptron (MLP)—were evaluated using R², Q², and RMSE as performance metrics. XGBoost achieved the best overall performance (Q² = 0.9947 and RMSE = 0.0137 for ΔG), with internal validation via StratifiedKFold and external validation confirming statistical robustness and strong generalization capability. The results demonstrate the potential of integrating computational chemistry and machine learning as a predictive framework for anticipating critical thermodynamic properties, supporting regulatory decision-making, and advancing data-driven pharmaceutical development strategies. | eng |
| dc.description.resumo | Desenvolvemos modelos de inteligência artificial para a predição de propriedades termodinâmicas associadas à degradação de insumos farmacêuticos ativos (IFAs), com foco na energia livre de Gibbs (ΔG) e na entalpia (ΔH), em alinhamento à RDC nº 964/2025 da Anvisa, que reforça a necessidade de compreensão aprofundada dos mecanismos degradativos em estudos de degradação forçada. Foi construída uma base de dados inédita com mais de 14.000 estruturas químicas, incluindo IFAs e produtos de degradação, obtidos a partir da lista DCB e de bases públicas como o PubChem, cujas propriedades foram calculadas por química quântica no Gaussian 16 (M06-2X/6-31G(d)). As moléculas foram representadas por Morgan fingerprints (RDKit), com avaliação de similaridade por índice de Tanimoto, e as variáveis termodinâmicas foram normalizadas para otimização do treinamento e posteriormente reconvertidas à escala original para preservar consistência físico-química. Foram avaliados os algoritmos XGBoost, Random Forest e Perceptron Multicamadas (MLP), utilizando R², Q² e RMSE como métricas de desempenho, sendo o XGBoost o modelo de melhor desempenho global (Q² = 0,9947 e RMSE = 0,0137 para ΔG), com validações interna (StratifiedKFold) e externa confirmando robustez estatística e elevada capacidade de generalização. Os resultados evidenciam o potencial da integração entre química computacional e aprendizado de máquina como ferramenta preditiva para antecipação de propriedades termodinâmicas críticas, suporte regulatório e otimização de estratégias de desenvolvimento farmacêutico orientadas por dados. | |
| dc.identifier.citation | SANTOS, Diullio Pereira dos.Thermopred : aplicação de inteligência artificial e química quântica na predição de propriedade termoquímica e espontaneidade de reações de degradação em insumos farmacêuticos ativos. 2026. 62 f. Tese (Doutorado em Química) - Instituto de Química, Universidade Federal de Goiás, Goiânia, 2026. | |
| dc.identifier.uri | https://repositorio.bc.ufg.br/tede/handle/tede/15296 | |
| dc.language | Português | por |
| dc.publisher | Universidade Federal de Goiás | por |
| dc.publisher.country | Brasil | por |
| dc.publisher.department | Instituto de Química - IQ (RMG) | |
| dc.publisher.initials | UFG | por |
| dc.publisher.program | Programa de Pós-graduação em Química (IQ) | |
| dc.rights | Acesso Aberto | |
| dc.subject | Propriedades termodinâmicas | por |
| dc.subject | RDC 964/2025 | por |
| dc.subject | Produtos de degradação | por |
| dc.subject | Inteligência artificial | por |
| dc.subject | XGBoost | por |
| dc.subject | Random Forest | por |
| dc.subject | Perceptron Multicamada | por |
| dc.subject | Thermodynamic properties | por |
| dc.subject | Degradation products | por |
| dc.subject | Artificial intelligence | por |
| dc.subject | Multilayer Perceptron | por |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::QUIMICA | |
| dc.title | Thermopred : aplicação de inteligência artificial e química quântica na predição de propriedade termoquímica e espontaneidade de reações de degradação em insumos farmacêuticos ativos | |
| dc.title.alternative | ThermoPred: AI-Enhanced Quantum Chemistry Data Set and ML Toolkit for Thermochemical Properties of API-Like Compounds and Their Degradants | eng |
| dc.type | Tese |