Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador

2026-05-112026-05-112025-12-09RIBEIRO, Pedro Schindler Freire Brasil. Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador. 2025. 51 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.https://repositorio.bc.ufg.br//handle/ri/30333This Course Completion Report aims to bring together the results of my journey to become an expert in Reinforcement learning applied to LLMs. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.porAcesso Abertohttp://creativecommons.org/licenses/by-nc-nd/4.0/Inteligência artificialLarge language modelsAprendizado por reforçoArtificial intelligenceLarge language modelsReinforcement learningAprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejadorTrabalho de conclusão de curso de graduação (TCCG)