Pós-treino de LLMs via aprendizado por reforço aprimoramento de raciocínio com ferramentas de busca externa

Pedrozo, Daniel Machado

Pós-treino de LLMs via aprendizado por reforço aprimoramento de raciocínio com ferramentas de busca externa

Arquivos

TCCG - Inteligência Artificial - Daniel Machado Pedrozo - 2025.pdf (14.36 MB)

Data

2025-12-09

Autores

Pedrozo, Daniel Machado

Editor

Universidade Federal de Goiás

Resumo

This Course Completion Report aims to bring together the results of my journey to become an expert in Reinforcement Learning in LLMs. An illustration and its narrative describe the work periods. The Appendices contain the Delivery Acceptance Terms and the results obtained during each work period.

Palavras-chave

Inteligência artificial, Large language models, Aprendizado por reforço, Artificial intelligence, Large language models, Reinforcement learning

Citação

PEDROZO, Daniel Machado. Pós-treino de LLMs via aprendizado por reforço aprimoramento de raciocínio com ferramentas de busca externa. 2025. 57 f. Trabalho de Conclusão de Curso (Bacharelado em Inteligência Artificial) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2025.

URI

https://repositorio.bc.ufg.br//handle/ri/30283

Coleções

INF - Trabalhos de Conclusão de Curso

Página do item completo

Pós-treino de LLMs via aprendizado por reforço aprimoramento de raciocínio com ferramentas de busca externa

Arquivos

Data

Autores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Descrição

Palavras-chave

Citação

URI

Coleções