Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador

Ribeiro,  Pedro Schindler Freire Brasil

Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador

Arquivos

TCCG - Inteligência Artificial - Pedro Schindler Freire Brasil Ribeiro - 2025.pdf (21.71 MB)

Data

2025-12-09

Autores

Ribeiro, Pedro Schindler Freire Brasil

Editor

Universidade Federal de Goiás

Resumo

This Course Completion Report aims to bring together the results of my journey to become an expert in Reinforcement learning applied to LLMs. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.

Palavras-chave

Inteligência artificial, Large language models, Aprendizado por reforço, Artificial intelligence, Large language models, Reinforcement learning

Citação

RIBEIRO, Pedro Schindler Freire Brasil. Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador. 2025. 51 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.

URI

https://repositorio.bc.ufg.br//handle/ri/30333

Coleções

INF - Trabalhos de Conclusão de Curso

Página do item completo

Aprendizado por reforço para decomposição de prompts treinamento e avaliação de modelo planejador

Arquivos

Data

Autores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Descrição

Palavras-chave

Citação

URI

Coleções