Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Goiás

Resumo

This Course Completion Report aims to bring together the results of my journey to become an expert in Reinforcement learning applied to LLMs. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.

Descrição

Citação

RIBEIRO, Pedro Schindler Freire Brasil. Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador. 2025. 51 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.